Gene Cagg_0743 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0743
Symbol
ID	7268062
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	920720
End bp	922504
Gene Length	1785 bp
Protein Length	594 aa
Translation table	11
GC content	56%
IMG OID	643565594
Product	sulphate transporter
Protein accession	YP_002462103
Protein GI	219847670
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0659] Sulfate permease and related transporters (MFS superfamily)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0253396
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.310729
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACAACC TGCTCGGTCG CTTACCCATC CTCTCCACCT GGCAACGCGA ATTTGCCGGT 
TATTCACCCA CACACCTCCG CTCAGACATA CTGGCCGGTT TGACAACCGG TGCCGTTGCG 
TTGCCTCTCG CACTTGCCTT CGGTGTTGCA TCTGGCGCCG ATGCTCCCGC CGGTCTCATT 
ACCGCCATTC TAGCCGGATT GATCATCGGT GGTCTTGGTG GCGCCGCTTA TCAGATTAGC 
GGTCCGACCG GTGCGATGTC GGCCATTCTG ATCGCGATCT CGGCGCGCTA TGGTATCGAA 
GGTGTGTGGG TTGCCACGCT CTTGGCCGGC CTGATAATGA TCGGTCTTGG ACTAGCCCGA 
CTCGGTCGCT ATATCGCGTT TATCCCCTCG CCGGTCATTG CCGGTTTTAC CGGTGGGATT 
GCCCTTATTA TCGCCATCGG TCAGCTTGAT AACGTGCTCG GTATTCAAAC CCCGAAAGCT 
GAAAACGCAC TTGAGAAGTT ACTCCACTAC TTCACCCATC CCCTGATCCC CGACCGGCAT 
ACGCTCGTCA TTGCCGGTAT CGTGATCGCG ATCATGATCG TCCTGCCACG TTTTCACAAA 
GGCATTCCCG CCTCGCTGGT TGGGATTATT GTAGCAACGG CGATCAGTGT CGGTCTAGGG 
TGGAATGTAC CGATCATCGG TGATATTCCA CAAACGATTT TGCTCGACCA TCGCCTGACA 
TGGCAAACCA TTCCATGGGA TCATCTTGGT GACCTATTAA CACCGGCCGT CTCGATTGCT 
GCACTCGGCG CAATCGAGAG TCTGCTATGC GGTGCGGTCG GCTCAACGAT GAGCGGTAAG 
CCGTTTGATA GCAATCAAGA ATTGGTAGCT CAAGGGATCG GAAACCTACT CATACCGTTC 
TTTGGTGGAG TGCCGGCTAC CGCTGCGATT GCCCGTACCA GCGTAGCAAT CAAGAGTGGA 
GCGGTAACCC GACTAACCAG TATTGTCCAT GCCTTACTGC TGCTCCTCAG CGCACTGGCC 
CTAGGGCCGA TTCTGCGCTA CGTTCCCCTT GCTGCGCTCG GCGGTGTCCT TCTGATGACT 
GCATGGCGCA TGAATGAGTG GGAGAGCATT CACTTCTTCG TCAATGCACG TCTCCGCCAC 
GCGCTTATCG GCTTCTTCAT CACGATGCTG GCGACTGCTG CGCTTGATCT CACGCAAGCG 
ATCTTAATCG GAATTGCGAT CTCGGCAGTA ATCTATCTCC GCCAATCGGC CACCAGTACG 
GTAGTGACCA GTTCGCCTAT CAATCCACAG CAACTGCAAG GGCAAGGTTC GCCGATTACT 
GCAACGTGCC CCAGCATTCA CGTCTACTAC TTGACCGGTC CTCTCTTTTT TGGTAGTGTC 
ACCACGGTGC TCGAAGCATT TGAAACCGCC GGCGATTATC ACACGATCAT CATCAGTATG 
CGCGGCGTAC CCCTGATCGA TGCAATGGGC ATTCAGGCCC TCCATCAGAT CGTCGAAGAA 
CACCATGCAC GCGGTGGTGA AGTCATTTTC ACCGCGTTGC AACCGAACGT ACTGGAGATG 
TTCAAACGCA CCGGTCTCTT CGACCTTGTC GGGGCACGGA ATATCTACTG GAGTTCGGCC 
CACGCGATTG TCGAACTGCA CGAAAAACGG CTGGTTGCCG GTTGCCCACG CTGCCATGCG 
CACGGCGACA GTTGTCAAGT CTTGCAGATG GCTCGTGAAC GACTCGGTAA CCAACCGACA 
CCGCTCTCCC TGCCTACAGC TTCTTCATCA ACGCATACGA GCTGA

Protein sequence

MHNLLGRLPI LSTWQREFAG YSPTHLRSDI LAGLTTGAVA LPLALAFGVA SGADAPAGLI 
TAILAGLIIG GLGGAAYQIS GPTGAMSAIL IAISARYGIE GVWVATLLAG LIMIGLGLAR 
LGRYIAFIPS PVIAGFTGGI ALIIAIGQLD NVLGIQTPKA ENALEKLLHY FTHPLIPDRH 
TLVIAGIVIA IMIVLPRFHK GIPASLVGII VATAISVGLG WNVPIIGDIP QTILLDHRLT 
WQTIPWDHLG DLLTPAVSIA ALGAIESLLC GAVGSTMSGK PFDSNQELVA QGIGNLLIPF 
FGGVPATAAI ARTSVAIKSG AVTRLTSIVH ALLLLLSALA LGPILRYVPL AALGGVLLMT 
AWRMNEWESI HFFVNARLRH ALIGFFITML ATAALDLTQA ILIGIAISAV IYLRQSATST 
VVTSSPINPQ QLQGQGSPIT ATCPSIHVYY LTGPLFFGSV TTVLEAFETA GDYHTIIISM 
RGVPLIDAMG IQALHQIVEE HHARGGEVIF TALQPNVLEM FKRTGLFDLV GARNIYWSSA 
HAIVELHEKR LVAGCPRCHA HGDSCQVLQM ARERLGNQPT PLSLPTASSS THTS