Gene GSU1695 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU1695
Symbol	thrC
ID	2685570
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	-
Start bp	1853254
End bp	1854639
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	60%
IMG OID	637126376
Product	threonine synthase
Protein accession	NP_952746
Protein GI	39996795
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0498] Threonine synthase
TIGRFAM ID	[TIGR00260] threonine synthase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCTACA TCAGCACCAG AGGAACCATT CAGCCCATTC GCTTCAAGGA CGCGGTCATG 
ATGGGGCTCG CCACCGATGG GGGGCTTCTT CTGCCGGAAA CAATACCGGC CATCGACCGG 
GACACGCTCG CGGCATGGAA GACGTTGCCG TTCCAGGAAC TCGCCTTCCG GATCATCTCC 
CGCTACGCCG ACGACATCCC GGCCGATGAC CTGCGGAGTC TCATTGAGCG CTCCTATGCA 
ACCTTTGATC ATCCCGACGT GACGCCGGTC GTGGAGCGGG GCGGCCTCCA CATCCTCGAA 
CTCTTCCACG GACCCACGCT TGCATTCAAG GACGTGGCTC TTCAGTTCCT GGGCAACCTC 
TTCGAATATC TGCTGCAGGA GCGGAACGAA CGGATGAACA TCGTCGGCGC CACGTCCGGC 
GACACGGGAA GTGCCGCCAT TTACGGCGTG CGGGGGAAGG AGAACATCAA CATCTTCATC 
CTCCATCCCC ACGGCAAAAC CTCGCCGGTC CAGGCGCTAC AGATGACCAC GGTACTCGAT 
CCCAACGTGC ACAACATTGC CGTGCGCGGC ACCTTTGACG ATTGCCAGAA CATCGTCAAG 
AGCCTGTTCA ACGACCTCCC CTTCAAGGAA CGCTACGCTC TCGGCGCCGT CAACTCCATC 
AACTGGGCCC GGGTACTGGC CCAGGTGGTC TATTACTTCC TCTCTTACTT CCGCGTGGCA 
AAGACCATTG GCGACGAAGT TGTCTTCTCG GTTCCCACGG GCAACTTCGG CGATATTTTT 
GCCGGCTACG TGGCCAAGCG AATGGGACTG CCCATTGCCA GACTGCTCCT GGCCACCAAC 
GAAAACAACA TTCTCGCCCG CTTCATCAAT GACGGAGACT ATTCGCTGAG TGCCGTGGTG 
CCCACTGTGT CGCCGTCCAT GGACATCCAG CTGGCTTCAA ACTTCGAACG CTATGTCTAC 
TATCTCTTCG GAGAAGACCC TGCCAGGGTC CGCGAGGCAT TCGCCACGCT TCCCGCCCGG 
GGCCGGATCG TCTTCTCCGA TGCCGAAATG GAGCACGTGC GCACCGAATT CCTTGCCTGT 
TCGGTTAACC AGCAGGAGAC CGTCGACACC ATCGCCTCCT TCAACCGTGA AACCGGCTAC 
CTCCTTGATC CCCACACGGC AGTGGGTGTC CGGGCTGCCC GGCAACTGGT GACCGACGGC 
ACGCCGGTCA TCTGCCTTGC CACTGCTCAC CCGGCGAAGT TCGCCGATGC CGTGGTGCGC 
GCAGTAGGGT TCGAACCGCC GCGTCCTCCA TCGCTCATGG GAATTGAAGA CCTGCCGAGC 
CGGTGCGAGG TGCTTGACGC ACGTATCGAG CAGATCAGGA CCTTCATCGA GGAGAAGGCC 
CGCTAA

Protein sequence

MRYISTRGTI QPIRFKDAVM MGLATDGGLL LPETIPAIDR DTLAAWKTLP FQELAFRIIS 
RYADDIPADD LRSLIERSYA TFDHPDVTPV VERGGLHILE LFHGPTLAFK DVALQFLGNL 
FEYLLQERNE RMNIVGATSG DTGSAAIYGV RGKENINIFI LHPHGKTSPV QALQMTTVLD 
PNVHNIAVRG TFDDCQNIVK SLFNDLPFKE RYALGAVNSI NWARVLAQVV YYFLSYFRVA 
KTIGDEVVFS VPTGNFGDIF AGYVAKRMGL PIARLLLATN ENNILARFIN DGDYSLSAVV 
PTVSPSMDIQ LASNFERYVY YLFGEDPARV REAFATLPAR GRIVFSDAEM EHVRTEFLAC 
SVNQQETVDT IASFNRETGY LLDPHTAVGV RAARQLVTDG TPVICLATAH PAKFADAVVR 
AVGFEPPRPP SLMGIEDLPS RCEVLDARIE QIRTFIEEKA R