Gene EcSMS35_2878 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2878
Symbol	cysD
ID	6142609
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	2948619
End bp	2949527
Gene Length	909 bp
Protein Length	302 aa
Translation table	11
GC content	54%
IMG OID	641617747
Product	sulfate adenylyltransferase subunit 2
Protein accession	YP_001744902
Protein GI	170679929
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0175] 3'-phosphoadenosine 5'-phosphosulfate sulfotransferase (PAPS reductase)/FAD synthetase and related enzymes
TIGRFAM ID	[TIGR02039] sulfate adenylyltransferase, small subunit

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	57
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCAAA TACGACTTAC TCACCTGCGG CAACTGGAGG CGGAAAGCAT CCACATTATT 
CGCGAGGTGG CGGCAGAATT CTCAAATCCG GTGATGCTCT ACTCTATCGG TAAAGATTCC 
AGCGTCATGC TGCATCTGGC GCGCAAGGCG TTTTATCCAG GTACGCTGCC TTTCCCGTTG 
CTGCATGTCG ATACCGGCTG GAAATTCCGC GAGATGTATG AGTTCCGCGA TCGTACGGCG 
AAAGCCTACG GCTGCGAGCT GCTGGTGCAT AAAAACCCGG AAGGCGTGGC GATGGGGATT 
AATCCATTCG TACACGGCAG CGCGAAACAT ACCGATATTA TGAAAACTGA AGGCCTGAAA 
CAGGCGCTGA ACAAATACGG TTTTGATGCC GCCTTCGGTG GTGCGCGCCG TGACGAAGAG 
AAATCCCGCG CTAAAGAGCG AATCTACTCT TTCCGTGACC GCTTCCATCG CTGGGATCCG 
AAAAATCAGC GCCCGGAGCT GTGGCACAAC TACAACGGGC AAATTAACAA AGGCGAAAGC 
ATCCGCGTCT TCCCGCTCTC TAACTGGACC GAGCAGGATA TCTGGCAATA CATCTGGCTG 
GAAAATATCG ACATTGTGCC GCTGTATCTC GCTGCGGAAC GTCCGGTTCT GGAACGCGAC 
GGTATGTTGA TGATGATTGA TGACAACCGT ATCGACCTGC AACCGGGCGA AGTGATTAAA 
AAACGGATGG TGCGTTTCCG TACGCTGGGC TGCTGGCCGC TGACCGGTGC GGTGGAGTCA 
AATGCACAAA CACTGCCGGA GATCATCGAA GAGATGCTGG TTTCCACCAC CAGTGAACGT 
CAGGGCCGCG TGATTGACCG CGACCAGGCG GGGTCTATGG AGCTGAAAAA ACGTCAGGGG 
TATTTTTAA

Protein sequence

MDQIRLTHLR QLEAESIHII REVAAEFSNP VMLYSIGKDS SVMLHLARKA FYPGTLPFPL 
LHVDTGWKFR EMYEFRDRTA KAYGCELLVH KNPEGVAMGI NPFVHGSAKH TDIMKTEGLK 
QALNKYGFDA AFGGARRDEE KSRAKERIYS FRDRFHRWDP KNQRPELWHN YNGQINKGES 
IRVFPLSNWT EQDIWQYIWL ENIDIVPLYL AAERPVLERD GMLMMIDDNR IDLQPGEVIK 
KRMVRFRTLG CWPLTGAVES NAQTLPEIIE EMLVSTTSER QGRVIDRDQA GSMELKKRQG 
YF