Gene GSU1904 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU1904
Symbol
ID	2688443
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	+
Start bp	2082217
End bp	2083245
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	54%
IMG OID	637126595
Product	decarboxylase family protein
Protein accession	NP_952953
Protein GI	39997002
COG category	[R] General function prediction only
COG ID	[COG1611] Predicted Rossmann fold nucleotide-binding protein
TIGRFAM ID	[TIGR00725] conserved hypothetical protein, DprA/Smf-related, family 1 [TIGR00730] conserved hypothetical protein, DprA/Smf-related, family 2

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0178748
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAACTGA GCTTTACGCG CACCAATGGC GAAATCGACA CACTCATTGA CACACTGATG 
GAGAAGGCTG GAACCATCCA TCACCCTACC CTGATACGTG AAATGATCAT TTCCGCTCTC 
AAATCGGGCC AGGAAACAAG CTATCCCGCA GACCTCAAAC TGCTCAACAA CACCATGAAG 
GAGATGCGCT ACACAACCAA CGTGTTCGCC CCCTACCGCA ATAGCCGGAA AGTGACCATC 
TTCGGCTCGG CCCGTACGGA GCCCCAGGAG CCGATTTATC AGACCTGCGT CCGCTTTAGC 
CGAAAACTTG CCGACAAGGG GTACATGATT ATCACCGGCG GAGGCCCGGG TATCATGCAA 
GCCGGAAATG AAGGCGCCGG CAGCGACCGC TCCTTTGCCG TAAACATCCG CCTTCCCTTC 
GAACAGAAGC CCAACCCCGT GATGCTCCAG AATCCGCGAC TCATAAATTA CAAGTACTTC 
TTCAACCGGA AAGTCGCCTT TGTCAAGGAG TCGAACGCAA TCGCCGTTTT CCCCGGCGGA 
TTCGGCACGC TTGACGAAGC CATGGAAGTC TTCACCCTCA TCCAGACGGG CAAGACCTCT 
CCCAAACCCC TTGTTCTTAT CGACGACAGT GACGGTTACT GGGATCGCTG GTTCGATTTC 
GTCACCTCGT GCATCCTCGG CAAAGGGTTC ATCTCTGCGG AGGATTTCTC CATTTTCACC 
ATTACCCGCG ACGAGGATGA GGCCATCAGG GTCATCGAAG AGTTCTACCA CAACTACCAC 
TCCCTCCGAT TCTTCGAAGA GAGGCTCATC ATCCGGCTCA ACAAAGAACT AACTCGGGAA 
CAGATCGATG AACTCGAAAA TGAATTCCCC GAATTGCGCC TGCCGGGCAC TCGCATAAGC 
TGCTGCCCCC CACTCCCCGA AGAGGCTGAT GAGCCCGACC TGCTTAAACT GCCTCGCATC 
TCGCTTCAGT TCGACCATCA ACACTACGGG CTCCTTATAG CTTTCATCAG AAAAATCAAC 
ATGTTTTAA

Protein sequence

MELSFTRTNG EIDTLIDTLM EKAGTIHHPT LIREMIISAL KSGQETSYPA DLKLLNNTMK 
EMRYTTNVFA PYRNSRKVTI FGSARTEPQE PIYQTCVRFS RKLADKGYMI ITGGGPGIMQ 
AGNEGAGSDR SFAVNIRLPF EQKPNPVMLQ NPRLINYKYF FNRKVAFVKE SNAIAVFPGG 
FGTLDEAMEV FTLIQTGKTS PKPLVLIDDS DGYWDRWFDF VTSCILGKGF ISAEDFSIFT 
ITRDEDEAIR VIEEFYHNYH SLRFFEERLI IRLNKELTRE QIDELENEFP ELRLPGTRIS 
CCPPLPEEAD EPDLLKLPRI SLQFDHQHYG LLIAFIRKIN MF