Gene Cag_0039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_0039
Symbol
ID	3747238
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	42581
End bp	44194
Gene Length	1614 bp
Protein Length	537 aa
Translation table	11
GC content	50%
IMG OID	637772565
Product	EmrB/QacA family drug resistance transporter
Protein accession	YP_378361
Protein GI	78188023
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily [TIGR00880] Multidrug resistance protein

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.677272
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAAACG CACCTTCTCT TTCAGCCTCG CCAAAGCTAC TCGGCACCAC CGAAGAGCAT 
TACGAAACAG GGTGGCGCAA GCTCATTATC ACCTTGACGG TTATTGTTTC CGCCATGCTG 
GAGCTGATTG ACACCACCAT TGTTAATGTG GCAATTACGC AAATTAGCGG CAACCTTGGA 
GCCAGCATTG AGGACACCGC ATGGGTGGTA ACAAGCTACG CCATTGCAAA CGTTATTGTA 
ATTCCACTCT CAGGCTTTCT TGGCAATTTG CTTGGGCGGC GGAACTACTA CATTGGCTCC 
ATTCTGCTCT TTACCGTCGC CTCTCTCCTG TGCGGCGTTG CAACCGACAT TTGGACACTT 
GTCTTTTTCC GCTTTGTGCA AGGCATTGGC GGTGGCGCAC TGCTCCCCAC CTCGCAAGCC 
ATTTTGTACG AAACCTTTCG CCCCGAAGAG CGCGGCAAAG CCACCGGTAT TTTTTCAATG 
GGCTTAGTGC TTGGACCAAC CATTGGACCA CTTTTAGGCG GCTACTTAGT AGATTATTTC 
AATTGGGAAT GGTGCTTTTT TGTCAACATT CCTATTGGAC TGTTAGCTGC TTGGTCATCC 
TTTATTTTTC TTAAAGAGCC AAAAGTTACC CACACTGTCT CAAAAATTGA TTGGGCTGGA 
ATTGGCTTAC TTGCCGTTGG CATTGGTTCC CTGCAATTCA TTTTAGAGCG AGGAGAATCC 
AAAGATTGGT TTGAAACCCC CTACATTACA TGGTTTACCA TTATTGCCGT ACTTTCGCTG 
ATTGCGTTTG TATGGCACGA ACTTCACACT AAGGAGCCTG CCGTTGACCT TCGTGTGCTG 
GCACGAAGCC ACAATTTGCC CATTGCTGCC GTGCTCACCT TTATTGTCGG CTTTGGTTTG 
TACGGTTCAC TCTTTGTTTT TCCCGTTTTT GTGCAAGGGC TGCTTGGTTT TACCGCTGTG 
CTCACCGGTT TAGTGCTCTT CCCCAGCGCT ATGGTTACCG GTATGATTTC CATGCCACTT 
GGCATGGCGC TGCAAAAAGG TGCCTCACCA AAGCATTTAA TGCTCTTTGG AATGCTCACC 
TTTTCACTTT TTTGCTGGCT ACTGGGGCAA CAAACCTTGC AATCAGGCGC CGAAAACTTT 
TTTTGGATAT TGCTGCTTCG CGGCATTGCA CTCGGCTTTA TTTTCATTCC CGTTACCATG 
CTCGCAATTT CGGGATTGCA TGGCAAAGAT ATTGGACAGG CAACTGGCTT AAACAACATG 
GTGCGCCAAC TTGGCGGCTC ATTCGGCATT GCTATTGCCA ACACCTACAT CGCCAAACGA 
GTAGCCGCAC ACCGCACCGA GCTACTAAGC CATCTTTCGC CTTACGACCC CGAAGCAATG 
AACCGCATAC ACGCCATTGC CGCCAAAGCC ACTGCTGAAC ACGGGCTGCC ACCCGCAAGC 
GCCGAACTTG CCGCCCTGAA AGCGCTTGAA GGTACGGTAA CCGTGCAAAG CACGCATCTT 
GCCTTTATGG ATGCCTTTAT GCTGATTGCT CTTCTTTTTC TCTGCGCTGT GCCACTACTC 
TTTTTTATTC GGCTGCATAA GGGGGAACAG GCAAGTGCAA TGGGGGGGCA TTGA

Protein sequence

MANAPSLSAS PKLLGTTEEH YETGWRKLII TLTVIVSAML ELIDTTIVNV AITQISGNLG 
ASIEDTAWVV TSYAIANVIV IPLSGFLGNL LGRRNYYIGS ILLFTVASLL CGVATDIWTL 
VFFRFVQGIG GGALLPTSQA ILYETFRPEE RGKATGIFSM GLVLGPTIGP LLGGYLVDYF 
NWEWCFFVNI PIGLLAAWSS FIFLKEPKVT HTVSKIDWAG IGLLAVGIGS LQFILERGES 
KDWFETPYIT WFTIIAVLSL IAFVWHELHT KEPAVDLRVL ARSHNLPIAA VLTFIVGFGL 
YGSLFVFPVF VQGLLGFTAV LTGLVLFPSA MVTGMISMPL GMALQKGASP KHLMLFGMLT 
FSLFCWLLGQ QTLQSGAENF FWILLLRGIA LGFIFIPVTM LAISGLHGKD IGQATGLNNM 
VRQLGGSFGI AIANTYIAKR VAAHRTELLS HLSPYDPEAM NRIHAIAAKA TAEHGLPPAS 
AELAALKALE GTVTVQSTHL AFMDAFMLIA LLFLCAVPLL FFIRLHKGEQ ASAMGGH