Gene GSU0752 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU0752
Symbol
ID	2687416
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	-
Start bp	796200
End bp	797540
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	67%
IMG OID	637125424
Product	transporter, putative
Protein accession	NP_951809
Protein GI	39995858
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGAGCCA GTGCTCAGAT GGAAAAGGTC GGGACGCGGC TACGGCTGAT GCTGCGGGCG 
CTGAATTCGC GGAATTACCG GCTGTTTTTC GCCGGACAGA GCGTGTCGCT GGTGGGCACC 
TGGATGCAGC AGGTTGCCAT GAGCTGGCTC GTCTACCGGC TGACCGGCTC GGCACTGTTG 
CTCGGGGTGG TCGGCTTCGT CAGCCAGATC CCGACCTTCC TCCTGGCGCC GGTGGCCGGG 
GTGCTGGCCG ACCGCTGGAA ACGCCGGCCG CTCCTCCTTG CCACCCAGAC CCTGGCCATG 
GTCCAGGCGG CGGTGCTGGC GGTCTTCGTA CTGACCGGGA CCACCCCGGT CTGGCTCATC 
GTCGCGCTGA GCGCCCTGCT CGGGGTGGTC AACGCCTTCG ACATCCCGAT CCGCCAATCG 
TTCGTGGTGG AGCTGGTGGA GAAAAAAGAA GACCTGGGAA ACGCCATCGC CCTCAACTCG 
TCCATGGTCA ACGGTGCCCG GCTGATCGGC CCGTCCATTG CCGGAGTGCT GGTCGCCACC 
CTGGGCGAGG GGATCTGTTT CCTGATCAAT GCAGCCAGCT ACCTGGCGGT GATCATCGCC 
ATAGCGGCGA TGCGGCTCAA GCCGGTGCCG CAGCGGCCCG GCCGCAAGCA TATCCTCCAT 
GAACTGCGCG AAGGATTCGG CTACGCCTTC GACTTCAAGC CGATCCGCTA CATCCTGATG 
CTCCTCGGCC TGGTCAGCCT GATGGGGATG CCCTACGTGG TGCTGATGCC GATCTTCGCC 
AAGGAGGTCC TGCACGGCGG GGCCCACACC TTCGGCTTCC TGATGGCCTC GGTCGGGATC 
GGCGCCTTCG GCAGCACCCT CTACCTCGCC TCCCGCACGA GCGTCCTCGG CCTCGGCCGG 
GTGATCGCGG TGGCCGCCTG CGTCTTCGGC TTCGGCATCG CCGGTTTCGC CCTGTCCAGC 
TCACTGGTCC TCTCGCCCCT GTTCCTCGCC CTGGCCGGCT TCGGCGCTAT GGCCCAGGTT 
GCCTCCAGCA ACACCATCCT CCAGACCATC GTCGACGACG ACAAACGGGG CCGGGTGATG 
AGTTTCTTCA CCATGTCGTT CATGGGAGCC ACCCCCATCG GCAGCCTGAT GGCCGGGGCC 
GTGGCCAACC GGATCGGCGC CCAGAACACC CTGCTGATCG GGGGTGCCGC CTGCCTGCTC 
GGCGGGGCGC TCTTCGGCCG GGAGCTGCGT AACCTCCGCC CCCTGGTCCG GCCCATCTAC 
GCCCGGCTCG GCATCATTCC CGAAGTGGCG GCCGGCATGC AGGCCGCTGC TGATCTGACG 
TGTCCACCGG AAGATCCCTA A

Protein sequence

MGASAQMEKV GTRLRLMLRA LNSRNYRLFF AGQSVSLVGT WMQQVAMSWL VYRLTGSALL 
LGVVGFVSQI PTFLLAPVAG VLADRWKRRP LLLATQTLAM VQAAVLAVFV LTGTTPVWLI 
VALSALLGVV NAFDIPIRQS FVVELVEKKE DLGNAIALNS SMVNGARLIG PSIAGVLVAT 
LGEGICFLIN AASYLAVIIA IAAMRLKPVP QRPGRKHILH ELREGFGYAF DFKPIRYILM 
LLGLVSLMGM PYVVLMPIFA KEVLHGGAHT FGFLMASVGI GAFGSTLYLA SRTSVLGLGR 
VIAVAACVFG FGIAGFALSS SLVLSPLFLA LAGFGAMAQV ASSNTILQTI VDDDKRGRVM 
SFFTMSFMGA TPIGSLMAGA VANRIGAQNT LLIGGAACLL GGALFGRELR NLRPLVRPIY 
ARLGIIPEVA AGMQAAADLT CPPEDP