Gene Cpha266_1111 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpha266_1111
Symbol
ID	4570151
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides DSM 266
Kingdom	Bacteria
Replicon accession	NC_008639
Strand	-
Start bp	1255528
End bp	1256862
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	47%
IMG OID	639765708
Product	major facilitator transporter
Protein accession	YP_911576
Protein GI	119356932
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00880] Multidrug resistance protein

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTTGTT ATCTTGGGAG CTTTAGCGCA ATAATAGAAT CTGCTTGCAT GAAGAAGTCC 
CCACTGGTCA TCCTTCTCTT AACGGTACTG CTTGATTTGA TCGGCTTTGG CATTGTACTG 
CCGCTTCTTC CGACTTATGC AAAAGACCTT GGTGCAAGCC CCCTGATGAT TGGGCTGATT 
GCTGCGATTT TCTCCATCAT GCAGTTCATC TTCTCCCCGC TCTGGGGCAA ACTGAGCGAT 
AAAATCGGTC GCAGACCGGT TATGCTCATC AGTATTTTCA TTACCGCCGT CTCCTATTTT 
GTTTTTTCAC AGGCCGTTAC CATCCCTCTT CTTATTTTTG CCAGAGGTCT TTCCGGAATA 
GGATCAGCCA ATATTGCCGC TGCCCAGGCA TACATCACCG ATGTCACCGA CAATCAAAAC 
CGGTCCAAAG CCATGGGAAT GATAGGTGCG GCTTTCGGCA TCGGATTTAT TATCGGCCCA 
TTGATCGGTG GCCTGCTCAA GCATAACTAC GGCATTGCTA TGGTAGGTTA TGTCGCATCA 
GCTCTGATTA CTCTTGACTT TATTCTGGCG ATTTTCCTCT TGCCGGAATC CAATAAACAT 
GCGATAAAAT TCAATTTCGG GTTTCTGAAA GAGAAGTCAG GAGCCGGTGC TTCAAATGAA 
AAGCCAACGA GCTCGTCTGG CAATAAAATG CAAGCCTACA TTGACGGCCT TAAACTTGCT 
TTCACCTCCC GACCACTTGC CCTCCTGATG ATTGCCAACT ATGTCTTCAC CTTTGCCATC 
GTCAATATGC AGGTAGCCTC GATTCTACTT TGGAAAGAGT ATTTTCATGC TTCCGATCAG 
GCTATCGGCT ATCTCTTCGC TTATGTGGGA TTCTTTTCTG TCGTTGTCCA GGGCGGCCTG 
ATAAGCAAAC TGATCAAGGC GCTTGGCGAA CACAAGCTGT TTTTCTGGGG TCATCTTTTT 
ACCTTTGTAG GGGTCTTTTT TATCCCTTTT CTGCCTTCAG ATACCCTCTT TTCGTTCGGA 
CTGTTCATTC TGTTTTTCTT CGCAATCGGA ACAAGCCTGG TGGCGCCCAT AAACATCTCG 
CTCATCTCGC TCTATACTTA CAAACAGAAG CAGGGGGAAA TCCTCGGACT GTCGCAATCC 
ATCAACTCGT TTGCACGCAT TATGGGCCCT TTCAGCGGCA GCGTTCTCTA TGGCCTGAAC 
GTCCACGCGC CTTATATCCT TGCCGGCGTG CTGACGTTGT TTGGCGCAGT GATTTCTCTC 
ATGCTGTTCA AGTATAAAAT AGATGCTCTG GATCCCGATC TGGACACACA GCCATCTTGG 
TCAAACAAGG ATTAA

Protein sequence

MFCYLGSFSA IIESACMKKS PLVILLLTVL LDLIGFGIVL PLLPTYAKDL GASPLMIGLI 
AAIFSIMQFI FSPLWGKLSD KIGRRPVMLI SIFITAVSYF VFSQAVTIPL LIFARGLSGI 
GSANIAAAQA YITDVTDNQN RSKAMGMIGA AFGIGFIIGP LIGGLLKHNY GIAMVGYVAS 
ALITLDFILA IFLLPESNKH AIKFNFGFLK EKSGAGASNE KPTSSSGNKM QAYIDGLKLA 
FTSRPLALLM IANYVFTFAI VNMQVASILL WKEYFHASDQ AIGYLFAYVG FFSVVVQGGL 
ISKLIKALGE HKLFFWGHLF TFVGVFFIPF LPSDTLFSFG LFILFFFAIG TSLVAPINIS 
LISLYTYKQK QGEILGLSQS INSFARIMGP FSGSVLYGLN VHAPYILAGV LTLFGAVISL 
MLFKYKIDAL DPDLDTQPSW SNKD