Gene Cag_1862 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1862
Symbol
ID	3747014
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	2370424
End bp	2371914
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	49%
IMG OID	637774399
Product	polysaccharide efflux transporter, putative
Protein accession	YP_380155
Protein GI	78189817
COG category	[R] General function prediction only
COG ID	[COG2244] Membrane protein involved in the export of O-antigen and teichoic acid
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCGAA ATTCGTTAGT TGCAGGGCAG GCAGGATTTG CCTTTGCGGG ATTGCTCTTT 
GGGCAACTGA TGCGCTTTGG TTATAACCTT GTGGTTGCCC GCTTGCTTGG CGTAGAAGCG 
CTTGGCATTT ATGCGCTTGC CATCGCTGTT ATGCAAGTTG CTGAAGTGGT TGCGCTTGCA 
GGGTGCGATG CATCACTGCT TCGTTTTGTC AACCTCTACC ACAACGATGC CGCACGTCAA 
CGCCAAGTGA TTGGCTTTGC CGCTAAAAGT AGCTTACTCT TCTCGCTTGC TGTTATGGCG 
TTGCTGATGC TCTTTGCCAA TCAACTCTCA GCGCTTTTCC ACGGCAATGA ACTGCTGACG 
TTGGCACTCT CCTGCTATGC AGCCGCCTTG CCATTCAATG TGTTAACACA GGTTACAGCG 
CACGCCTTGC AAGCATTTCA GCACTTAAAG CCGAAAATTA TTGCCACGCA ACTGCTCAGT 
CCATTGCTTT TGCTGCTCTT CACCTTGCTT TTTTATTATA CCGTTGGCAT ACAAGCGGCA 
TTGCTTATGC CCTTTCTCCT TTCAGCATGT GGCGCATTGC TCTGGATTCT TCTACCATTT 
GCCACAACCA CCGGCATTCG CTTTATTGAC ATTGTACGCG CTCGGCACGA TAACGCCATG 
CTAACCTATG CCTTGCCACT TATGGCAGTC TCGCTCTTTA GTATGCTAAG CCACTGGCTT 
GATGTGATGA TGCTTGGCAT CTTTAGCGAT GCAGTTACCG TTGGATTGTA CCATCCAGCC 
GCAAGAACCG CAGGCTTGTT ACGCTCCGTG CTTTTGGCAT TTGCAGGCAT TGCCGCACCG 
CTTTTTGCAG AGCTTCACGC ACAAGGCAAC AAAGCCGAAA TGGCTCGTCT CTACAAATTA 
GTTACACGCT GGAGCGTTAT CCTCCTTATT CCCCCTCTCT TGATTTTTAT GGTGCTACCG 
CAGCAAGTAC TTTCGCTTTT TGGCGCCCAC TTTGCCGATA GCGGAGCTGT AGCCTTGCAA 
CTCTTAAGCG CCGCATATTT TGTACAATGC GTTTTTGGCA TTGCCTCCAC CCTGCTTGCT 
ATGAGCGGCT ATGCTCAACT CAGCCTCATA AACGCCGTTG TAGCACTTGC CTTACAAGCA 
GGCTTAAATT GGCTTTTTAT TCCAACAATG GGATTACAAG GCGCAGCCGT TGCATCGTTA 
GTGCTCTTTC TCTTGCTCTC AGCACTTCGA TGGCTGGAAG TTCGCCTCTT ATTGCAGATG 
AATCCATTAA GCACCATGTT GTGGAAGCCG CTCGTTGCTG GAGCTGTTAC CTTCTTGCTA 
CTCATGCTCA TGCACTCGTG GTTGCTCATG CTGCCATCGT TGCTGGCGCT TGGGGTTGGA 
ACCGTTATTG CCTTTAGCTG TTATGTGGCT CTGATGTTGA TGCTGAAGTT GGAAGTGGAT 
GAGAAGGAGA TTATTTTCAA GTATCTGCCT TTTATGAGGA AGGATGGATA G

Protein sequence

MSRNSLVAGQ AGFAFAGLLF GQLMRFGYNL VVARLLGVEA LGIYALAIAV MQVAEVVALA 
GCDASLLRFV NLYHNDAARQ RQVIGFAAKS SLLFSLAVMA LLMLFANQLS ALFHGNELLT 
LALSCYAAAL PFNVLTQVTA HALQAFQHLK PKIIATQLLS PLLLLLFTLL FYYTVGIQAA 
LLMPFLLSAC GALLWILLPF ATTTGIRFID IVRARHDNAM LTYALPLMAV SLFSMLSHWL 
DVMMLGIFSD AVTVGLYHPA ARTAGLLRSV LLAFAGIAAP LFAELHAQGN KAEMARLYKL 
VTRWSVILLI PPLLIFMVLP QQVLSLFGAH FADSGAVALQ LLSAAYFVQC VFGIASTLLA 
MSGYAQLSLI NAVVALALQA GLNWLFIPTM GLQGAAVASL VLFLLLSALR WLEVRLLLQM 
NPLSTMLWKP LVAGAVTFLL LMLMHSWLLM LPSLLALGVG TVIAFSCYVA LMLMLKLEVD 
EKEIIFKYLP FMRKDG