Gene Cag_1339 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1339
Symbol
ID	3746854
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	+
Start bp	1806943
End bp	1808520
Gene Length	1578 bp
Protein Length	525 aa
Translation table	11
GC content	44%
IMG OID	637773877
Product	putative sugar transport protein
Protein accession	YP_379642
Protein GI	78189304
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.922881
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCACGTA ATGTTGTAAA TGCTGAGCAA ACGGAAGAGG TTAGCAGCAC TCGGCGGGTT 
ATTGCTGCAT CCTCCGTTGG CACGCTCATT GAGTGGTACG ACTTCTACAT TTTTGGAAGT 
CTTGCCAAAA TTATTTCCGA ACAATTTTTC CCAAAAGACA ATCCAACAGC AGCCTTGCTG 
GCAACGCTTG CTACTTTTGC GGCTGGCTTT GTGGTACGCC CCTTTGGTGC CCTCTTTTTT 
GGTCGCTTGG GCGATCTTAT CGGAAGAAAG TACACCTTTC TTGTTACGCT GGTTATTATG 
GGTGGCTCAA CCTTTGCAAT TGGTTTAGTA CCTGGTTACG CAACTATTGG TTTTGCTGCG 
CCTGCAATTG TGTTTGTGCT GCGCTTACTG CAAGGTTTAG CGCTGGGCGG TGAGTATGGC 
GGTGCGGCAA CCTATGTGGC GGAGCACTCT CCAAACGGTA AACGTGGTTT TTGGACAAGC 
TTTATTCAAA CCACAGCAAC CTTTGGTCTC TTTCTGTCGC TTGGCGTTAT TTTAATTGTT 
CGCCAAACGC TTGGTGTTGA AACCTTTCAA GATTGGGGCT GGCGCGTACC ATTTATTCTT 
TCTGCATTTT TAGTTGGCGT TTCAATTTAC ATCCGCATGA AAATGTCGGA ATCGCCAATG 
TTTGCTAAAA TGAAGAAAGA GGGCAAAACC TCAGCTAATC CACTTGCCGA AAGCTTTAAG 
CAAAAGGATA ACCTGAAAAT GGTGCTGCTT GCTTTGCTTG GTGCTACGGC TGGTCAAGGT 
GTGGTTTGGT ACACAGGTCA ATTCTATGCT CTTTCATTTT TGCAAAACGC TTGCAACATT 
GAGTTTGAGC AAAGCAACTT GATTATTCTT ATTGCACTTG TTATTGGCAC CCCATTCTTT 
GTGATTTTTG GTGCGCTCTC CGACAAAATT GGTCGTAAGT ACATTATGAT GGCTGGTATG 
TTTATTGCCG TGCTTGCTTA TCGTCCTATT TACACCATGA TGTACAACGA TGCCAATCTC 
AAAAATAAAA TTGAGATTGT TGACCAAACC ACCGTTGAAA CCAAAGAAGA GGTAAAAGGC 
ACCGACAACG TTATTACCAC CGTAACGAAA AAAACTTTTG AGGATGGTAC CACTTACAAA 
GAAATCAAAA AAGAGACCAT CCCGCTTGAT GCTGCAAAAA AAGCTGAACT TGCTGCTGCC 
GACAAGCTAA AGCCTGAAAC CAAAAAAGAG GTAGTTCTGC CACAGCACTT GTACTACAAA 
ATGATTGGTT TAGTGCTAAT TCAGGTGATT TTTGTTACCA TGGTGTATGG TCCAATTGCA 
GCATTCCTTG TTGAAATTTT CCCAACACGC ATTCGCTACA CCTCCATGTC GCTCCCTTAC 
CACATTGGTA ACGGTGTATT TGGTGGTTTA GTACCGCTGA TTTCAACCCG TCTTGTAGAA 
GCAACCCGTC CTGCTGCTGG CTTACCTCCA GCCGATCCGC TTGCTGGCTT GTGGTATCCA 
ATTATTATTG CTGGCGTAAG CTTTGTTATT GGTATGCTTT ACATTTCAAA CAACACCAAC 
AACATGGACG TTGAGTAA

Protein sequence

MARNVVNAEQ TEEVSSTRRV IAASSVGTLI EWYDFYIFGS LAKIISEQFF PKDNPTAALL 
ATLATFAAGF VVRPFGALFF GRLGDLIGRK YTFLVTLVIM GGSTFAIGLV PGYATIGFAA 
PAIVFVLRLL QGLALGGEYG GAATYVAEHS PNGKRGFWTS FIQTTATFGL FLSLGVILIV 
RQTLGVETFQ DWGWRVPFIL SAFLVGVSIY IRMKMSESPM FAKMKKEGKT SANPLAESFK 
QKDNLKMVLL ALLGATAGQG VVWYTGQFYA LSFLQNACNI EFEQSNLIIL IALVIGTPFF 
VIFGALSDKI GRKYIMMAGM FIAVLAYRPI YTMMYNDANL KNKIEIVDQT TVETKEEVKG 
TDNVITTVTK KTFEDGTTYK EIKKETIPLD AAKKAELAAA DKLKPETKKE VVLPQHLYYK 
MIGLVLIQVI FVTMVYGPIA AFLVEIFPTR IRYTSMSLPY HIGNGVFGGL VPLISTRLVE 
ATRPAAGLPP ADPLAGLWYP IIIAGVSFVI GMLYISNNTN NMDVE