Gene Gura_0789 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gura_0789
Symbol
ID	5165297
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter uraniireducens Rf4
Kingdom	Bacteria
Replicon accession	NC_009483
Strand	-
Start bp	940606
End bp	941844
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	60%
IMG OID	640548287
Product	major facilitator transporter
Protein accession	YP_001229570
Protein GI	148262864
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTTTCA TCATGTTGAC CGTGCTGATC GACATGGTGT CTATCGGTTT GATCATTCCC 
GTGTTGCCGT CGTTGGTCGG AAGTTTCACC GACTCACAAG CAAATCAGGC GTTCTGGTAT 
GGCGTCGTGG TGTTCGCGTT CGGAATCGCG AATTTTTTCG CTTCGCCGAT CCTCGGTGCG 
CTGTCCGACG CTTACGGTCG CCGCCCGTTG CTCTTGCTCG GTTTTTGCGG ACTCGGCCTC 
AATTTTTTCG CAACAGGGCT CTCCACGGCG TTGTGGATGC TGATTGCGGT GCGGCTGGTG 
GGCGGTGCGA TGCAGGCCAA TGCGGCCGTG GCTAACGCGT ATGTGGCGGA TATCACCGTT 
CCCGAAGAGC GTGCCAGGCG TTTCGGCATG TTGGGCGCGA TGTTCGGCGT TGGCTTCATC 
GTCGGGCCGG TGATGGGCGG GCTGCTGGGC GCAATCACCA TACAGCTCCC GTTTTTCGTC 
GCCGGCGCCT TTGCAATGAT TAACTGGCTC TACGGCTATT TTGTGTTACC CGAGTCGCTC 
CCTGCCGAGC GCCGGCGCCC ATTCCACTGG CGGATGGCAA ACCCGCTCGT GTCGCTACGC 
GCGCTGACCC GGCTGAGCGG TGTCGGCCGA TTGGTCGCCG TGGTTGCGTT GAGCGGACTT 
GCCCAATTCG TGCTGTTCAC CAGTTGGGTG TTGTACACGA CCTTCAAGTT CGGCTGGGGA 
CCGCGTGAAA ACGGCTGGTC GCTCGCAGCG GTCGGCATCA TGTCGTTGGT CGTGCAGGGT 
TTTCTGCTCG GACGGCTGCT GAAACGCTTT AGTCCGCGAC GCCTTGTGGT TGCCGGACTG 
GCGTCGTCGT CGATCGCCTA CATATTGTGG GGCATAGCCA ACCAGGGCTG GATGATGTAC 
GCAGTAATCT TCCTGAATCT GCTTAGCTAT ACGGTTACTG CGTCGCTGCA AAGCATAATT 
TCCAGCGCCG CCGACTCCCA AAGCCAGGGG CAGGCGTTGG GGGCGGTCAA CTCCCTGAAC 
AGCCTGATGG CGGTAGTGGC CCCCTTGTTC AGCACGCCGC TGCTTGCGAC GGTTTCCCAT 
TTGCAGCGCG GCGATTGGCG CATCGGCGCG CCGTTCTATT TTTGCGCCCT GCTTCAAGCC 
GCATCGCTGG CCTTGGCGTA TTTTCATTTC CGCAGCGAGC ACCATGCGAC GCCCGCGACG 
GCGTCAGAAG TGCAGAGAGG CAGTGGGGGC AACCCTTGA

Protein sequence

MPFIMLTVLI DMVSIGLIIP VLPSLVGSFT DSQANQAFWY GVVVFAFGIA NFFASPILGA 
LSDAYGRRPL LLLGFCGLGL NFFATGLSTA LWMLIAVRLV GGAMQANAAV ANAYVADITV 
PEERARRFGM LGAMFGVGFI VGPVMGGLLG AITIQLPFFV AGAFAMINWL YGYFVLPESL 
PAERRRPFHW RMANPLVSLR ALTRLSGVGR LVAVVALSGL AQFVLFTSWV LYTTFKFGWG 
PRENGWSLAA VGIMSLVVQG FLLGRLLKRF SPRRLVVAGL ASSSIAYILW GIANQGWMMY 
AVIFLNLLSY TVTASLQSII SSAADSQSQG QALGAVNSLN SLMAVVAPLF STPLLATVSH 
LQRGDWRIGA PFYFCALLQA ASLALAYFHF RSEHHATPAT ASEVQRGSGG NP