Gene GSU1798 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU1798
Symbol
ID	2685639
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	-
Start bp	1963664
End bp	1965250
Gene Length	1587 bp
Protein Length	528 aa
Translation table	11
GC content	55%
IMG OID	637126485
Product	putative alpha-isopropylmalate/homocitrate synthase family transferase
Protein accession	NP_952848
Protein GI	39996897
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR00977] 2-isopropylmalate synthase/homocitrate synthase family protein

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0044129
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCTTG TAAAACTCTA CGATACGACT CTCCGCGACG GAACCCAGGC GGAGGATATT 
TCCTTCCTCG TGGAGGACAA AATCCGGATC GCCCATAAAC TCGATGAGAT AGGCATTCAC 
TACATCGAGG GTGGGTGGCC CGGCAGCAAT CCGAAGGATG TTGCCTTTTT CAAGGACATC 
AAGAAAGAGA AACTCTCCCA GGCGAAGATC GCTGCGTTCG GTTCCACCCG TCGTGCCAAG 
GTAACCCCCG ACAAGGACCA TAACCTCAAG ACCCTCATTC AGGCGGAACC AGATGTCTGC 
ACCATATTCG GCAAGACATG GGATTTTCAC GTGCATGAGG CACTGCGGAT ATCGCTCGAG 
GAAAATCTTG AGTTGATTTT CGACTCGCTG GAATACCTTA AGGCGAATGT TCCCGAGGTC 
TTCTACGACG CCGAGCACTT TTTCGACGGC TACAAGGCGA ACCCGGACTA CGCCATCAAG 
ACCCTCAAGG CCGCTCAGGA CGCAAAGGCC GACTGCATTG TTCTCTGCGA CACCAACGGC 
GGTACCATGC CCTTCGAGCT TGTCGAGATT ATCCGCGAGG TGCGCAAGCA CATCACGGCC 
CCTCTCGGCA TCCACACGCA CAACGATTCA GAGTGCGCCG TTGCCAACTC CCTCCATGCG 
GTCAGCGAAG GAATTGTCCA AGTCCAGGGT ACCATCAACG GTTTCGGCGA GCGCTGTGGC 
AATGCCAACC TCTGCTCGAT CATCCCTGCC CTGAAACTCA AGATGAAGCG CGAGTGCATT 
GGGGACGACC AGCTTAGAAA ACTTCGCGAT CTTTCACGAT TCGTCTACGA ATTGGCCAAC 
CTTTCGCCCA ACAAGCATCA GGCATATGTG GGCAACTCGG CATTTGCCCA CAAGGGCGGC 
GTCCACGTAT CGGCCATCCA GCGCCATCCT GAAACCTATG AGCACCTGCG GCCGGAGCTG 
GTCGGCAACA TGACGCGGGT ACTCGTTTCC GACCTGTCTG GTCGCTCCAA TATCCTTGCT 
AAGGCAGAAG AGTTCAATAT CAAGATGGAT AGCAAGGACC CCGTTACGCT CGAAATTCTC 
GAAAATATAA AGGAAATGGA GAACCGGGGT TACCAGTTCG AAGGGGCGGA AGCGTCGTTC 
GAGCTCCTCA TGAAAAGAGC CCTCGGCACC CACCGCAAGT TTTTCTCGGT GATCGGTTTC 
CGGGTAATCG ACGAAAAGCG CCATGAGGAC CAGAAGCCTC TTTCTGAAGC TACAATCATG 
GTCAAGGTGG GGGGCAAAAT CGAGCACACC GCAGCTGAGG GAAATGGTCC GGTGAATGCA 
TTGGACAATG CTCTCCGCAA AGCCTTGGAG AAGTTTTATC CGCGCCTCAA GGAAGTAAAG 
CTGCTGGACT ACAAGGTGCG CGTATTGCCG GCGGGGCAGG GGACGGCCTC GTCTATCAGG 
GTGCTCATCG AGTCTGGCGA TAAAGAGAGC CGCTGGGGTA CGGTCGGTGT TTCGGAAAAC 
ATTGTCGATG CATCCTACCA GGCTCTTCTG GACAGTGTGG AGTACAAGCT CCACAAAAGC 
GAAGAGATCG AAGGCTCCAA GAAGTGA

Protein sequence

MSLVKLYDTT LRDGTQAEDI SFLVEDKIRI AHKLDEIGIH YIEGGWPGSN PKDVAFFKDI 
KKEKLSQAKI AAFGSTRRAK VTPDKDHNLK TLIQAEPDVC TIFGKTWDFH VHEALRISLE 
ENLELIFDSL EYLKANVPEV FYDAEHFFDG YKANPDYAIK TLKAAQDAKA DCIVLCDTNG 
GTMPFELVEI IREVRKHITA PLGIHTHNDS ECAVANSLHA VSEGIVQVQG TINGFGERCG 
NANLCSIIPA LKLKMKRECI GDDQLRKLRD LSRFVYELAN LSPNKHQAYV GNSAFAHKGG 
VHVSAIQRHP ETYEHLRPEL VGNMTRVLVS DLSGRSNILA KAEEFNIKMD SKDPVTLEIL 
ENIKEMENRG YQFEGAEASF ELLMKRALGT HRKFFSVIGF RVIDEKRHED QKPLSEATIM 
VKVGGKIEHT AAEGNGPVNA LDNALRKALE KFYPRLKEVK LLDYKVRVLP AGQGTASSIR 
VLIESGDKES RWGTVGVSEN IVDASYQALL DSVEYKLHKS EEIEGSKK