Gene Rcas_2033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_2033
Symbol
ID	5539511
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	2606015
End bp	2607319
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	62%
IMG OID	640894168
Product	glutamate-1-semialdehyde aminotransferase
Protein accession	YP_001432139
Protein GI	156742010
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0001] Glutamate-1-semialdehyde aminotransferase
TIGRFAM ID	[TIGR00713] glutamate-1-semialdehyde-2,1-aminomutase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAACCT ACCGTTCTGA GTCACTGTTC GCAGAAGCGC GTTCGCTCTT CCCCGGCGGC 
GTCAACAGTC CGGTGCGCGC CTTTCGCGCC GTCGGCGGCG CGCCGCGCTT TATTGCGCGC 
GGCGAGGGGG CATTTCTCGT TGATGTCGAT GGCAATCGCT ACATCGATTA CGTTCTGTCG 
TGGGGACCAC TGATCCTGGG GCATGCGCAC CCCAATGTTG TTGCCGCCAT CGCCGAACAG 
GCGGCGCATG GCACGTCGTT CGGCGCCCCG ACCGAACTCG AAAGCGAACT GGCACGTCTG 
ATCACACAGG CGATGCCCTC GGTTGAAATG GTGCGCTTCG TCTCGTCGGG CACCGAAGCA 
GCAATGAGCG CCCTGCGCCT CGCGCGCGCC GCAACCCGCC GCGACAAGGT CATCAAGTTT 
GCCGGCTGTT ACCATGGGCA CTTCGACGGA TTTCTGGTGC AGGCTGGCTC CGGTGTAGCA 
ACGCTTGGCT TGCCGGACAG TCCGGGGGTG ACGGCGGCAA CGGCTGCAAG TACGTTGACG 
GCGCCGTATA ACGATCTTGA TGCGGTAGAG TCGCTGTTGA AGGCGAATCC CGGCGAAGTG 
GCGGCGATTG CCGTCGAACC GGTTGCCGGA AACATGGGAC TGGTGCTGCC ACAACCCGGT 
TTTCTCGAAG GTTTGCGCCG CTTAGCCGAC GAACATGGCG CACTGCTGAT CTTCGACGAG 
GTTATGACCG GCTTTCGAGT AGGGTATGGC GGCGCACAAG GAAAGTATGG CATCACCCCT 
GATCTTACCT GTCTCGGCAA GGTGATTGGC GGTGGTTTAC CGGCTGCCGC CTATGGCGGA 
CGGCGCGATC TGATGGAACT GATCGCGCCC GCCGGTCCGG TGTATCAGGC AGGCACCCTT 
TCCGGCAATC CGCTGGCAAT GGCGGCTGGC GCGGCGACCC TGCGGGCTAT CAGGGCGCCT 
GGCGTCTTTG AGCAATTGGA ACGGGCAGCG GCGATGCTCT GTTCTGGTTT TGAGCACGCT 
GCCGCCGAAG CGGACATCGC GCTGCGTACT GCTTATGCCG GCAGCATGTG GGGTTTCTTC 
TTCACCGATG AACCGGTGGT CGATTATGTC TCGGCGAAGA AATCAGATAC GCAACGCTAC 
GCGCAGTTCT TCCACGCGAT GCTGGAACGC GGCATCTACC TGGCGCCAGC CCAATTCGAG 
GCATCTTTCG TATCGCTCGC GCATAGCGAT GCGCTCATTC AAGAGACGAT TGCCGCCGCC 
GCCGACGCGC TACGATCGAT CCAGAACGCT GCTCGGAAAG GCTGA

Protein sequence

MKTYRSESLF AEARSLFPGG VNSPVRAFRA VGGAPRFIAR GEGAFLVDVD GNRYIDYVLS 
WGPLILGHAH PNVVAAIAEQ AAHGTSFGAP TELESELARL ITQAMPSVEM VRFVSSGTEA 
AMSALRLARA ATRRDKVIKF AGCYHGHFDG FLVQAGSGVA TLGLPDSPGV TAATAASTLT 
APYNDLDAVE SLLKANPGEV AAIAVEPVAG NMGLVLPQPG FLEGLRRLAD EHGALLIFDE 
VMTGFRVGYG GAQGKYGITP DLTCLGKVIG GGLPAAAYGG RRDLMELIAP AGPVYQAGTL 
SGNPLAMAAG AATLRAIRAP GVFEQLERAA AMLCSGFEHA AAEADIALRT AYAGSMWGFF 
FTDEPVVDYV SAKKSDTQRY AQFFHAMLER GIYLAPAQFE ASFVSLAHSD ALIQETIAAA 
ADALRSIQNA ARKG