Gene Achl_1066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Achl_1066
Symbol
ID	7292511
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter chlorophenolicus A6
Kingdom	Bacteria
Replicon accession	NC_011886
Strand	-
Start bp	1168402
End bp	1170132
Gene Length	1731 bp
Protein Length	576 aa
Translation table	11
GC content	71%
IMG OID	643589474
Product	sulphate transporter
Protein accession	YP_002487149
Protein GI	220911840
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0659] Sulfate permease and related transporters (MFS superfamily)
TIGRFAM ID	[TIGR00815] high affinity sulphate transporter 1

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	67
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAGCA CCGCCGGGAT GGGCCATGAT CGGAGCATGA GCCGCTCCGG TAAACCCCAG 
TCCTGGTGGA TCCCGCCGGC CCTGCGCGGT TACAAAGCCG GGTGGCTGCG GCACGATGCG 
GTGGCAGGGG CCGCGCTCTT CGCGGTGCTG GTCCCCGCGG GCATGGCCTA CGCGCAGGCC 
GCCGGGCTCC CGCCGGTGAC CGGACTTTAT GCCACGGTGG TGCCCCTGAT CGCCTACGCG 
ATCGTGGGTC CATCCCGGGT GCTGGTGCTG GGCCCGGACT CGGCGCTCGC CCCGATGATC 
GTCGCCGCCC TGATTCCCCT GGCCGCGGCG GATGAACAGC GGTCCGTCGC CCTCGCGGGC 
CTCCTTGCCA TACTGATCGG CGCCATCATG CTCATCGGTT CGGCGCTGCG GCTGGGCATC 
GTCACGGGGC TGCTGTCCAA GCCCATCCGG CTGGGCTACC TCAACGGCAT CGCCCTGCTG 
GTGGTTGCCT CCCAGCTGCC CGTCCTCCTG GGCATTTCCG TGGACGGTGA CACCCCTTGG 
GACAAGCTCC TGGCCGCTGT GCCGAAGGTG CTCGACGGCG AAACCAACCT GACGGCGCTG 
CTGCTGGGGC TCGCCTCGCT GGCACTCATC CTGGTGCCGC GGTGGCTGAA GTGGAAGGTC 
CCCGGCGTGC TGATCGCCGT CGTCGTATCC TGCCTGGCCG TGGGCCTGCT GGGACTCCGC 
GACAGCGTCA AGGTCACCGG TGCCCTGCCG CAGGGGCTCC CGTCCCCGGC CCTTGGCGGC 
ATCGGCTGGG CCGACGTCCT GGCACTGCTT CCCGCCGCCG CCGGCATCGC CCTGATCGTC 
TTCGTGGACA CCGGAACCCT GTCCCAATCT TTGGCTGCGG CCCGGAACGG CAAGGTCTCC 
GGCAACCACG AGATGGCGGC CCTCGGCGCG GCCAACGCAG CCAGCGGCCT CTTCGGCGGC 
TTCCCCATCT CCGCCAGCAC CTCCCGCACC CCGGTGGCAG TGGATTCCGG ATCGAAATCC 
CAGCTGACAG GTGTGGTGGG CGCCCTCCTG GTCCTGGCCT TCATGCTGGC GGCGCCCGGC 
GTCACCGAGT TCCTGCCCGC CGCCACGCTG GCCGCCATCG TCATCGCCGC GGCCGCCGGA 
ATCGCCGACC CCGCCGGGGT GCGCCGGCTG GTCAGCATGA GCCGCAGCGA ATCGCTGGTG 
ATGCTGGCGG CCTTCCTCGG CGTCACCATC CTGGGCGTCC TGCCGGGCAT CGTCGTGGCC 
GTCGGGCTGG CCATCCTGGA CTTCCTGCGG CGGGCCTGGG ACCCCTACCG CGCCGAACTG 
GTGGATGTCC CCGGCGTGCC CGGCTACCAC GACGTCACCC GCCACCCCGA GGGCGAGCGC 
ATCCCCGGCC TGCTGATCCT GCGCTTCGAC GCCCCGCTGT TTTTCGGCAA CGGCGCGCTG 
CTGGGATCCT TCGTGCGCGA CGAACTGGAC GACGCCCCGC CCGGCACCGA CCGCGTAGTA 
CTGGCGGCCG AGCCCGTGAC CGGCATCGAC ACCACCGCCC TGGACGAGCT GGTGGAACTC 
GACGAATGGC TGGAACGGCA CGGCGTGGAC CTGGTGTTCG CGGAAATGAA GGGCCCGGTC 
AAGGACAGGC TGCTGCGGTA CGGCATGGGC GCCCGCTTCT CCCCCGCGCA CTTCTATCCC 
ACCACCAGCG AGGCCGTGCG GGCTTACCAG CGGGAGAAGC GCCAGGCGTA G

Protein sequence

MASTAGMGHD RSMSRSGKPQ SWWIPPALRG YKAGWLRHDA VAGAALFAVL VPAGMAYAQA 
AGLPPVTGLY ATVVPLIAYA IVGPSRVLVL GPDSALAPMI VAALIPLAAA DEQRSVALAG 
LLAILIGAIM LIGSALRLGI VTGLLSKPIR LGYLNGIALL VVASQLPVLL GISVDGDTPW 
DKLLAAVPKV LDGETNLTAL LLGLASLALI LVPRWLKWKV PGVLIAVVVS CLAVGLLGLR 
DSVKVTGALP QGLPSPALGG IGWADVLALL PAAAGIALIV FVDTGTLSQS LAAARNGKVS 
GNHEMAALGA ANAASGLFGG FPISASTSRT PVAVDSGSKS QLTGVVGALL VLAFMLAAPG 
VTEFLPAATL AAIVIAAAAG IADPAGVRRL VSMSRSESLV MLAAFLGVTI LGVLPGIVVA 
VGLAILDFLR RAWDPYRAEL VDVPGVPGYH DVTRHPEGER IPGLLILRFD APLFFGNGAL 
LGSFVRDELD DAPPGTDRVV LAAEPVTGID TTALDELVEL DEWLERHGVD LVFAEMKGPV 
KDRLLRYGMG ARFSPAHFYP TTSEAVRAYQ REKRQA