Gene GSU3099 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU3099
Symbol	hisC
ID	2688464
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	-
Start bp	3402517
End bp	3403569
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	62%
IMG OID	637127792
Product	histidinol-phosphate aminotransferase
Protein accession	NP_954140
Protein GI	39998189
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01141] histidinol-phosphate aminotransferase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTTCCCT TTCGCTCAAA TATTGCCGCC ATGGCAGGCT ATGTCCCCGG TTACCAACCT 
CCGGACGTGG CGTCGTGGAT CAAGCTGAAC ACCAATGAGA ACCCCTATCC GCCGTCGCCC 
GAGGTGGTGA AGGCAATCCT GGCGGAGTTA GGGGGTGACG GGGCGCTCCT GCGCACCTAT 
CCCAGCGCTT CGAGCCAGGT GCTGCGGGAG ACCGTGGGCG AGCTGTTCGG CTTCGATCCC 
GCGTGGATCA TCATGGCCAA CGGCTCTGAC GAGGTCCTCA ATAACCTGAT ACGGGCCTTT 
GCCGGCGAGG GGGAGGAAAT TGGCTACGTG CATCCCTCCT ACTCCTACTA CGCGACCCTG 
GCCGAAATCC AGGGGGCACG GGTGCGGACT TTCGGCCTTA CGGATGACCT TCGCATTGCC 
GGTTTTCCCG GCCGCTACGA GGGAAAGCTC TTCTTCCTGA CCACCCCGAA TTCGCCGCTG 
GGCTTCGCTT TTCCCCTTGC CTACATCGAG GAACTGGCAA CCCGCTGTGC CGGGGTCCTG 
GTGGTTGACG AGGCCTATGC CGATTTCGCC GACGGTGATG CCTTGGATCT GGTGCGGCGA 
CACGAGAACG TGGTCGTGAC CCGTACCCTG TCCAAGAGCT ATTCCCTGGC CGGGATGCGG 
CTTGGTTTCG CCGTGGCCCG TCCGGCGGTG ATTGCGGCCC TGGACAAGAT CCGCGATCAC 
TATAACCTTG ACCGTCTCGC CCAGGCCGCC TGCGTGGCCT CCCTGCGGGA TCAGACATAC 
TTTGCCGGGT GTACCCGCCT GATCCGCGAG ACCCGCGAGT GGTTTTCCGC TGAAATCCGG 
ACGCTCGGCT ACGAGGTGAT CCCCTCCCAG GGGAACTTCG TGTTTGCCGC GCCGCCGGAC 
CGTGACGGTA AACGGGTCTA CGACGGCCTC TACTCCCGAA AGATCCTGGT TCGTCATTTC 
TCCGACCCGC TCCTGGCCCA TGGCATGAGG ATTTCCATCG GCACGCGGGA GGAGATGGAG 
GCGACTCTCG CCGCCCTGAA AGAGATTGGC TAA

Protein sequence

MLPFRSNIAA MAGYVPGYQP PDVASWIKLN TNENPYPPSP EVVKAILAEL GGDGALLRTY 
PSASSQVLRE TVGELFGFDP AWIIMANGSD EVLNNLIRAF AGEGEEIGYV HPSYSYYATL 
AEIQGARVRT FGLTDDLRIA GFPGRYEGKL FFLTTPNSPL GFAFPLAYIE ELATRCAGVL 
VVDEAYADFA DGDALDLVRR HENVVVTRTL SKSYSLAGMR LGFAVARPAV IAALDKIRDH 
YNLDRLAQAA CVASLRDQTY FAGCTRLIRE TREWFSAEIR TLGYEVIPSQ GNFVFAAPPD 
RDGKRVYDGL YSRKILVRHF SDPLLAHGMR ISIGTREEME ATLAALKEIG