Gene GSU2055 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU2055
Symbol
ID	2686021
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	+
Start bp	2256159
End bp	2257193
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	61%
IMG OID	637126746
Product	extracellular solute-binding protein
Protein accession	NP_953104
Protein GI	39997153
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1638] TRAP-type C4-dicarboxylate transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.923985
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACGCT TCACCCTGTT CATGCTCCTC GCGCTGCTGC CGGCATCGCT CGTCCCCGCA 
GCCGGCACCG CCCGCGCCCA GTCGACCATC ACCCTCACCT ACGCCAACTT CCCGCCCGCG 
GCTACCTTCC CCTGCATCCA GATGGAGCGC TGGGCCAAAG AAGTGGAAAA GCGAACCGGC 
GGCAAGGTGA AGGTAAAGAC CTTTCCCGGC GGCACGCTCC TCAACGCCAA GAACATGTTC 
GAGGGGGTTA CCTCCGGCAT CGCCGATATC GGCAACTTCG CCATGAGCTA CCAGCCGGGC 
CGCTTCCCTG TGTCCGAAGC GGTGGACCTT CCCCTGGGCT TCACGAGCGC CAGGGTGGCA 
AGCCTCGTTC TCTACGACCT GATCGAAAAG TACAAGCCCA GGGAGTTTGA AAAGGTAAAA 
GTACTGACGG TCTTCACCTG TCCTCCCACC AATTTCATGA CCAAGGCGCC GGTACGGCGC 
CTGGCCGACC TGAAGGGAGT GGAACTCCGC GTGGCTGGCA CAAGCGCCGA AGTAGCCAAG 
CGCCTGGGGG CGGTACCGGT GGCCATGCCA CAATCGGAAA CCCCCGAAGC GATCCAGAAA 
GGGATTGTCA AGGGGATGAT CTCTTCCCTT GAAATTCTCC AGGATCTCAA GTTCGCCAGC 
TACACCCCCT ACGCGACCAT CGCCAACCTG CCGGTGGTTT CCTTTGCGGT GGTCATGAAC 
AAGGCCAAGT GGGATTCGCT CCCCGCCGAC GTCAAGAATG CCCTGGACAC CCTTTCCCGC 
GATCAGGCCG CATGGACCGG CGAGTACGCC GACCGCCACG TGCAGGAATC TCTCGCTTGG 
GCGAAGAAGG GCTACCAGCA TCAGGTATTC ACCCTGCCGG CCGCCGACCA GAAGCAGATC 
AACGCACTCC TCTCCCCCAT GGTGGACGAC TACGTCAAAA AGGTGAGCGC CCAGGGGCTC 
AACGGCAAGC AGATCGTGAC GGACGTGCAG GCATTCCGGA AGAAGTACGA GACGCCGGCG 
AAGAAAAAGC GGTAG

Protein sequence

MKRFTLFMLL ALLPASLVPA AGTARAQSTI TLTYANFPPA ATFPCIQMER WAKEVEKRTG 
GKVKVKTFPG GTLLNAKNMF EGVTSGIADI GNFAMSYQPG RFPVSEAVDL PLGFTSARVA 
SLVLYDLIEK YKPREFEKVK VLTVFTCPPT NFMTKAPVRR LADLKGVELR VAGTSAEVAK 
RLGAVPVAMP QSETPEAIQK GIVKGMISSL EILQDLKFAS YTPYATIANL PVVSFAVVMN 
KAKWDSLPAD VKNALDTLSR DQAAWTGEYA DRHVQESLAW AKKGYQHQVF TLPAADQKQI 
NALLSPMVDD YVKKVSAQGL NGKQIVTDVQ AFRKKYETPA KKKR