Gene Cphamn1_1823 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphamn1_1823
Symbol
ID	6375514
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides BS1
Kingdom	Bacteria
Replicon accession	NC_010831
Strand	+
Start bp	1977420
End bp	1978613
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	53%
IMG OID	642684320
Product	major facilitator superfamily MFS_1
Protein accession	YP_001960222
Protein GI	189500752
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.536913
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCACAGA ACAGAGAAGC TGTCATACGG ACCGTTGTTC CCGGCTCTTT AACCGCCTTT 
TCAACGGTGA TAAGTGATAA CCAACAGGAT TGCATGTCAG GTAAGTCAGG CAGGAGTACC 
GTGAAATTTG CAGAATCTGT CGCGCTTATC GCGATGATGA TGTCTCTCGC CGCGCTTTCT 
ATCGATGCCA TGCTCCCTGC CCTTCCTGCG ATCGGCCGTG AACTTGGCGT CCTGCAGGAA 
AACACCAACC AGCTTGTCAT CTCTCTCTTG TTTCTCGGCA TGTCGGCCGG ACAGATTCTT 
TACGGTCCGA TGTCTGATTC AGCCGGCAGA AAGCCCGCGA TCTATACCGG TTTCGGCATT 
TTCATCACAG GAACGCTCTT CTGCCTCTTC GCCACGAGCT TCACCATGAT GCTCTCCGGC 
AGGATCCTTC AGGGGGTAGG AGCCGCAAGC ACCCGCATTG TTTCCATAGC AATCGTGCGT 
GATCAATACG AGGGACCGAA AATGGCGCGC GTCATGTCTT TTGTCATGAC AATATTTATC 
CTCATACCGA TTCTCGCACC TGCTCTCGGG CAAACCATGC TTAACGCATC TGGATGGAGA 
GCCATCTTCG GTATCTTACT GTTTCTCTCC CTCTTCACGC TCGCCTGGTT CTCATTACGC 
CAGCCAGAGA CCCTGAGCAG GGAAAAACGC ATCCCGTTTA CCATCAAAAG AATAGTGACA 
GCCATCCGTG AAGTACTGGG TATTCGACAG TCATTAGCCT ATACCATCAT TTCAGGCCTC 
GTCTTCGGTT CTTTTCTCGG ATACCTGAAC TCCTCTCAGC AGATCCTGCA GATACAGTAT 
GGACTCGGAG AAGATTTCCC GCTCTACTTC GGCATACTTG CCACCGCTTT CGGTGCAGCG 
ACCCTGCTGA ACTCAAAACT CGTCATGCTC TTCAGAATGC ACTCTCTCGT CCATCATGCG 
ATGCACGCCC TTGCCGTGCT CTCCGGGTTG TTTCTCGTCG CTGCAATGAC GCAAAACGGG 
CACCCTCCCC TCTGGGCTTT CCTCATCTAC CTTCTGCCTG TTTTTTTACC ATCGGCATCC 
TGTTCGGAAA CCTCAACACT CTGGCAATGG AACCACTCGG GCACATTGCG GGTATCGGGG 
CATCGACAAT CGGCTCCCTC TCGACCTTCC TCGCGTTGTC AGTCGGTACG GTGA

Protein sequence

MPQNREAVIR TVVPGSLTAF STVISDNQQD CMSGKSGRST VKFAESVALI AMMMSLAALS 
IDAMLPALPA IGRELGVLQE NTNQLVISLL FLGMSAGQIL YGPMSDSAGR KPAIYTGFGI 
FITGTLFCLF ATSFTMMLSG RILQGVGAAS TRIVSIAIVR DQYEGPKMAR VMSFVMTIFI 
LIPILAPALG QTMLNASGWR AIFGILLFLS LFTLAWFSLR QPETLSREKR IPFTIKRIVT 
AIREVLGIRQ SLAYTIISGL VFGSFLGYLN SSQQILQIQY GLGEDFPLYF GILATAFGAA 
TLLNSKLVML FRMHSLVHHA MHALAVLSGL FLVAAMTQNG HPPLWAFLIY LLPVFLPSAS 
CSETSTLWQW NHSGTLRVSG HRQSAPSRPS SRCQSVR