Gene Rcas_1155 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_1155
Symbol	glyA
ID	5538621
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	1494384
End bp	1495694
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	60%
IMG OID	640893287
Product	serine hydroxymethyltransferase
Protein accession	YP_001431270
Protein GI	156741141
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0112] Glycine/serine hydroxymethyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTATGC TTCAGACCCT CTGGCGCAGT GATCCTGCCG TTGCGCGCAT TATCGATGGC 
GAGATGCGCC GTCAGCGCGA CGGATTGGAA CTGATTGCCA GCGAAAACTA TGCCAGTCGC 
GCCGTGATGG AAGCACAGGG TTCAGCGCTC ACGAACAAAT ATGCCGAAGG ATATCCGGGC 
GCACGCTACT ACGGCGGCTG CGAATGGGTC GATCAGGTGG AAGACCTGGC GCGCGCGCGG 
GTCAAAGAGT TGTTCGGCGC AGAATATGCA AATGTGCAGC CGCACTCCGG GTCACAGGCG 
AACATGGCCG TCTACTTCAC TTTTCTGCGA CCCGGTGATA AGGTGCTCGG CATGAATCTG 
GCGCACGGCG GGCACCTGAC TCATGGCTCC CCGGTTAACT TTTCGGGTCA GTTGTACACC 
TTCGTGGCGT ATGGCATCGA TCCCAAGACC GAACGGATCG ATTACGATCA GGTGGCAGAG 
ATTGCGCGCC GCGAGCGCCC CAAAATGATC ACGGTCGGCG CCAGCGCCTA TTCGCGTGCC 
ATCGATTTTG CCATCTTCCG TCAGATCGCC GATGAAGTCG GCGCGTTTCT CTTCGCCGAT 
ATTGCGCACC CTGCCGGGTT GATCGCCAAA GGGTTGCTGC CTAGCCCCAT CCCCTACGCT 
CACGTCGTTA CCTCGACCAC CCACAAGACG CTGCGCGGGC CACGCGGCGG CATCATCATG 
ATGGGGAAGG ACTTTGAGAA CCCATTCGGG TTGAAGGCAG CGAAGAGCGG TCGCACCCTG 
ATGATGTCGG AACTGCTCGA CAAAATGGTC ATCCCCGGTG TGCAGGGCGG TCCCTTGATG 
CACGTCATCG CTGCCAAAGC GGTCGGATTC GGCGAAAACC TGCAACCGGA GTTCGAGACG 
TATGCCCGTC AGATTATCCG CAATGCGCAG ACACTGGCAG GCGCCCTGAT GGCGCGTGGA 
TACCACATCC TCTCCGGCGG CACCGACAAC CACCTGATGC TTATCGACCT GCGCAACAAG 
GGAGTGAGCG GCAAGGCGGC GCAGGAGGCG CTCGACCGCG CCGCCATCAC GACCAATAAG 
AATGCCGTCC CCAACGACGA CAAATCGCCA TTGATCACCA GTGGCATTCG GCTGGGAACC 
CCTGCACTGA CCACCCGCGG CATGAAGGAA CCGGAGATGG AACAGATTGC GGCACTGATC 
GACGATGTCA TCACGCATAT CAATGACGAT CATACCATCA ATCGGGTGCG CGAAGAGGTG 
TTCGCGCTCT GCGCGCGCTT CCCGGTGCCG GGGCTGGAAC CATCCGCCTG A

Protein sequence

MSMLQTLWRS DPAVARIIDG EMRRQRDGLE LIASENYASR AVMEAQGSAL TNKYAEGYPG 
ARYYGGCEWV DQVEDLARAR VKELFGAEYA NVQPHSGSQA NMAVYFTFLR PGDKVLGMNL 
AHGGHLTHGS PVNFSGQLYT FVAYGIDPKT ERIDYDQVAE IARRERPKMI TVGASAYSRA 
IDFAIFRQIA DEVGAFLFAD IAHPAGLIAK GLLPSPIPYA HVVTSTTHKT LRGPRGGIIM 
MGKDFENPFG LKAAKSGRTL MMSELLDKMV IPGVQGGPLM HVIAAKAVGF GENLQPEFET 
YARQIIRNAQ TLAGALMARG YHILSGGTDN HLMLIDLRNK GVSGKAAQEA LDRAAITTNK 
NAVPNDDKSP LITSGIRLGT PALTTRGMKE PEMEQIAALI DDVITHINDD HTINRVREEV 
FALCARFPVP GLEPSA