Gene EcolC_1257 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1257
Symbol
ID	6065215
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	1375380
End bp	1376477
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	59%
IMG OID	641600672
Product	sulfate/thiosulfate transporter subunit
Protein accession	YP_001724250
Protein GI	170019296
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1118] ABC-type sulfate/molybdate transport systems, ATPase component
TIGRFAM ID	[TIGR00968] sulfate ABC transporter, ATP-binding protein

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00109195
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGCATTG AGATTGCCAA TATTAAGAAG TCGTTTGGTC GCACCCAGGT GCTGAACGAT 
ATCTCACTGG ATATTCCTTC AGGTCAGATG GTCGCGTTGC TGGGGCCGTC CGGTTCCGGG 
AAAACCACGC TGCTGCGCAT TATCGCCGGG CTGGAGCATC AAACCAGCGG GCATATTCGC 
TTCCACGGCA CCGACGTGAG CCGCCTGCAC GCACGTGATC GTAAAGTCGG TTTCGTGTTC 
CAGCATTACG CGCTGTTCCG CCATATGACG GTGTTCGACA ATATCGCTTT TGGCCTGACG 
GTGCTGCCGC GTCGCGAGCG CCCGAATGCC GCAGCCATCA AAGCGAAAGT GACAAAATTG 
CTGGAAATGG TCCAGCTTGC CCATCTGGCG GATCGTTATC CGGCGCAGCT TTCCGGCGGC 
CAGAAACAGC GCGTGGCGCT GGCGCGCGCG CTGGCTGTGG AACCGCAAAT TCTGCTGCTT 
GATGAACCGT TTGGCGCGCT GGATGCGCAG GTGCGTAAAG AGCTGCGTCG CTGGCTGCGT 
CAACTCCATG AAGAACTAAA ATTCACCAGC GTTTTTGTGA CCCACGATCA GGAAGAAGCG 
ACCGAAGTAG CTGATCGTGT AGTTGTGATG AGCCAGGGCA ATATTGAACA GGCTGACGCG 
CCGGATCAGG TATGGCGCGA ACCGGCGACC CGTTTTGTGC TCGAATTTAT GGGCGAAGTG 
AACCGCCTGC AGGGAACCAT TCGCGGCGGG CAGTTCCATG TTGGCGCGCA TCGCTGGCCG 
CTGGGCTACA CACCTGCGTA TCAGGGGCCG GTGGATCTCT TCCTGCGCCC TTGGGAAGTG 
GATATCAGCC GCCGTACCAG CCTCGATTCG CCGCTGCCGG TACAGGTACT GGAAGCCAGC 
CCGAAAGGTC ACTACACCCA ATTAGTGGTG CAGCCGCTGG GGTGGTACAA CGAACCGCTG 
ACGGTCGTGA TGCATGGCGA CGATGCCCCG CAGCGTGGCG AGCGTTTATT CGTTGGTCTG 
CAACATGCGC GGCTGTATAA CGGCGACGAG CGTATCGAAA CCCGCGATGA GGAACTTGCT 
CTCGCACAAA GCGCCTGA

Protein sequence

MSIEIANIKK SFGRTQVLND ISLDIPSGQM VALLGPSGSG KTTLLRIIAG LEHQTSGHIR 
FHGTDVSRLH ARDRKVGFVF QHYALFRHMT VFDNIAFGLT VLPRRERPNA AAIKAKVTKL 
LEMVQLAHLA DRYPAQLSGG QKQRVALARA LAVEPQILLL DEPFGALDAQ VRKELRRWLR 
QLHEELKFTS VFVTHDQEEA TEVADRVVVM SQGNIEQADA PDQVWREPAT RFVLEFMGEV 
NRLQGTIRGG QFHVGAHRWP LGYTPAYQGP VDLFLRPWEV DISRRTSLDS PLPVQVLEAS 
PKGHYTQLVV QPLGWYNEPL TVVMHGDDAP QRGERLFVGL QHARLYNGDE RIETRDEELA 
LAQSA