Gene Bind_1334 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_1334
Symbol
ID	6200862
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010581
Strand	-
Start bp	1543296
End bp	1545002
Gene Length	1707 bp
Protein Length	568 aa
Translation table	11
GC content	57%
IMG OID	641705328
Product	major facilitator transporter
Protein accession	YP_001832463
Protein GI	182678317
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTTTTT CGACCAGTGC TGTGCGCCAG CACGTTGAAA AACGGCCGAT GTCTTCAGCG 
GAACGAAAAG TAATTTTCGC CTCCTCGCTG GGAACGGTCT TTGAATGGTA CGATTTTTAT 
CTTTATGGCT CTTTGGCCAG TATCATCGGC GCTCAATTCT TTAGCCAATT TCCGAAAACC 
ACTGCCGATA TTTTCGCGCT TCTCGCTTTC GCGGCGGGTT TTCTCGTGCG CCCCTTCGGC 
GCTCTCGTCT TCGGCCGGCT GGGTGATCTC GTCGGACGTA AATATACCTT CCTGGTGACG 
ATCCTGATCA TGGGTCTGTC GACCTTCGTC GTCGGTCTTT TGCCGAATTA CGATTCGATC 
GGCATTGCCG CGCCCATCAT CCTGATTTCC GCCCGTCTTC TCCAGGGTCT CGCGCTCGGC 
GGTGAATATG GCGGGGCGGC CACCTATGTG GCGGAACATG CGCCGCATGG ACGCCGCGGC 
TTTTACACCT CTTGGATTCA GACCACCGCG ACGCTGGGCC TGTTCCTGTC CCTGCTGGTG 
ATCCTGGGAA CCCGCACCTT TTTTGGCGAA GCTCGTTTCG CTGAAATCGG CTGGCGTGTG 
CCCTTCATTG TTTCGGTCCT GCTGCTCCTC GTCTCCTTGT GGATTCGTCT GCAATTGAGC 
GAATCGCCGG CCTTCCTGAA AATGAAGGAA GAAGGCACCG TTTCCGAGAA GCCGCTGACG 
GAAGCTTTCG CCACCTGGTC GAATGCCAAA ATCGCTTTGC TCGCCTTGTT CGGTCTCACC 
ATGGGCCAAG GCGTCGTCTG GTACACGGGC CAGTTCTATT CCTTGTTCTT CCTGCAATCG 
ATCTGCAAGG TCGACGGCTA TACGGCCAAT CTGCTCATCG CTTGGGCGCT TGTTTGCGGT 
ACCGGATTCT TCGTCTTCTT CGGCTGGCTC TCCGATCATA TCGGTCGCAA GCCCATCATC 
CTCACGGGCT GCTTGCTGGC TGCCCTGACC TATTTCCCGA TCTATCGGGC GATTACCGCC 
AACGCCAATC CGGCTCTTGC TCAGGCCCTT GAAACGGTCA AAGTCAAGGT TGTGGCGGAC 
CCGGCGGATT GCGGCAATCT CTTCAATCCC GTCGGTACGC GCGTCTTTAC CAGCTCCTGC 
GATATCGCCC GCGACTTCCT GGCCAAGAGC GCGGTCCGTT ATGAAATGGT GCCCGGGCCG 
GCTGGCAGCC CCGCGCAGAT CGTCGCCGAT GGCGTCAACG TCACCGCATT CGACTCGACG 
CAAGTCTCCA ATGCGAAAAC GGCCATGGCC GATTTCTCGA AAACAGCCAC TGCGGCCCTC 
CAAGAGGCTG GCTATCCCAA GCCCAATGAT CCGGGCATCA TTCGGATGAA ACATCCGTTC 
GATCTTTCGG AACCGCGTGT CTTACATTTG ATCGGCCTGC TCGCCATTCT CGTCATCTAT 
GTGACGATGG TTTATGGCCC GATCGCCGCG GCCCTCGTCG AATTGTTCCC GACGCGGATT 
CGGTACACGT CAATGTCCCT GCCCTACCAT ATCGGCAACG GCTGGTTCGG CGGTCTGCTG 
CCGGCCACGG CTTTCGCCAT GGTCGCCCAG ACAGGTGATA TTTATTACGG CCTCTGGTAC 
CCGATCATCT TCGCCGGCAT CACGTTCGTC ATCGGCTCCC TGTTCATTCC CGAAACCAAG 
GACCGGGACA TTTACGCCGA GGATTAA

Protein sequence

MVFSTSAVRQ HVEKRPMSSA ERKVIFASSL GTVFEWYDFY LYGSLASIIG AQFFSQFPKT 
TADIFALLAF AAGFLVRPFG ALVFGRLGDL VGRKYTFLVT ILIMGLSTFV VGLLPNYDSI 
GIAAPIILIS ARLLQGLALG GEYGGAATYV AEHAPHGRRG FYTSWIQTTA TLGLFLSLLV 
ILGTRTFFGE ARFAEIGWRV PFIVSVLLLL VSLWIRLQLS ESPAFLKMKE EGTVSEKPLT 
EAFATWSNAK IALLALFGLT MGQGVVWYTG QFYSLFFLQS ICKVDGYTAN LLIAWALVCG 
TGFFVFFGWL SDHIGRKPII LTGCLLAALT YFPIYRAITA NANPALAQAL ETVKVKVVAD 
PADCGNLFNP VGTRVFTSSC DIARDFLAKS AVRYEMVPGP AGSPAQIVAD GVNVTAFDST 
QVSNAKTAMA DFSKTATAAL QEAGYPKPND PGIIRMKHPF DLSEPRVLHL IGLLAILVIY 
VTMVYGPIAA ALVELFPTRI RYTSMSLPYH IGNGWFGGLL PATAFAMVAQ TGDIYYGLWY 
PIIFAGITFV IGSLFIPETK DRDIYAED