Gene Rcas_3843 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3843
Symbol
ID	5541347
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	5023605
End bp	5024924
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	60%
IMG OID	640895953
Product	aminotransferase class-III
Protein accession	YP_001433898
Protein GI	156743769
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0001] Glutamate-1-semialdehyde aminotransferase
TIGRFAM ID	[TIGR00713] glutamate-1-semialdehyde-2,1-aminomutase

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0711014
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.172621
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGCGA CGATGACGAA CGCAACGCTG GTCGAGCGCG CCCGGCAGGT GATTCCCGGC 
GGGGTGAATT CCGGCAATCG CGTTCTTCCC TGGCCCATTG CGTTTGTGCG CGCCGAAGGC 
GCCTATCTGT TCGACGCCGA TGACCGCCAG TATCTTGATT ATCACGCCGC CTTCGGACCG 
ATCATTCTCG GACACAACCA TCCTCAGGTG AATGCCGCTG TTGCCGAAGC GATGAGCCGC 
ATCGACATCA TTGGAGCAGG CGTCACAGAC CTGGAAGTGG AACTTGCCGA CCGCCTCAAC 
CGCCATATTC CCTGCGCCGA GCGCGTCCTG CTGACGAACT CCGGCTCTGA AGCGACGTAT 
GCCGCGCTCC GTCTGGCGCG CGCCGTCACC GGGCGCAACA AGATCATCAA GTTTCAAGGG 
ACCTACCACG GCTGGCACGA TGCCGTCTTG ATGAATGTCA TCAGCCCGCC GGAAAAGATC 
GGTCAGCATG ATCCGCTCTC GCTCGGCATG CTTCCCGATG TGATCCGTCA CACGATTGTG 
TTGCCGTTCA ACGATACCGA AGCGGTCGCC GACACGCTGC ACCGCCAGGG TGAGGAGATC 
GCCGCCGTTC TTGTGGAGGT GATCCCGCAC AATATCGGGT GTGTGTTGCC ACGGCCGGAG 
TTTCTTCAGG CGCTGCGCGA CCTGACGCGC CAGCACGGTG TGATGCTGAT CTTCGATGAG 
GTCATCACCG GTTTTCGCCA TGCCCTCGGT GGCTATCAGT CGATTGTCGG AGTGACGCCC 
GACCTGGCAA CGTTTGCCAA GGCGATGGCG AATGGTTTCC CTATTGCTGC GCTTGCGGGT 
CGCGCAGAAC TGATGGATCG TTTTGCGCCC GGCGGCGGGG TGTTCTTTGC CGGAACGTAC 
AATGGGCATA GCATCGGCGT AGCGGCGGCG CTGGCGACGA TTGCAGAACT CGAGAGCGGC 
GAGGTTCATG CACACTGCTT TGCGCTGGCG CAGATCGCCG CAGACGGGTT GATGCAGATT 
GCTGCCGAAC TCGGCATTCC GCTCACGGTC GCGCGCTTCG GGTCGGTGTT CGTTCCCTAC 
TTTATGGAAC CCGCTCCGAT CGAGAACTAT ACCGATCTGT TCCGCAACAA TACGGCGCGA 
GACCTCTGGT TCCGCAAAAC GATGTGCGAG CACGGTATCT TCATGATCCC GACAGCCCTC 
AAACGCAATC ATGTAAGTGC GGCGCACACT CGTGCCGATA TTGATCGCAC GCTGGAGATC 
GCTCGCCAGG TGTTGCGTGC GATGCCGGCG GATCTTGAGC GCAGTGCTCG TTATCCATGA

Protein sequence

MTATMTNATL VERARQVIPG GVNSGNRVLP WPIAFVRAEG AYLFDADDRQ YLDYHAAFGP 
IILGHNHPQV NAAVAEAMSR IDIIGAGVTD LEVELADRLN RHIPCAERVL LTNSGSEATY 
AALRLARAVT GRNKIIKFQG TYHGWHDAVL MNVISPPEKI GQHDPLSLGM LPDVIRHTIV 
LPFNDTEAVA DTLHRQGEEI AAVLVEVIPH NIGCVLPRPE FLQALRDLTR QHGVMLIFDE 
VITGFRHALG GYQSIVGVTP DLATFAKAMA NGFPIAALAG RAELMDRFAP GGGVFFAGTY 
NGHSIGVAAA LATIAELESG EVHAHCFALA QIAADGLMQI AAELGIPLTV ARFGSVFVPY 
FMEPAPIENY TDLFRNNTAR DLWFRKTMCE HGIFMIPTAL KRNHVSAAHT RADIDRTLEI 
ARQVLRAMPA DLERSARYP