Gene EcE24377A_3053 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_3053
Symbol	cysD
ID	5588993
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	3054191
End bp	3055099
Gene Length	909 bp
Protein Length	302 aa
Translation table	11
GC content	54%
IMG OID	640926699
Product	sulfate adenylyltransferase subunit 2
Protein accession	YP_001464075
Protein GI	157158131
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0175] 3'-phosphoadenosine 5'-phosphosulfate sulfotransferase (PAPS reductase)/FAD synthetase and related enzymes
TIGRFAM ID	[TIGR02039] sulfate adenylyltransferase, small subunit

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.305816
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATCAAA AACGACTTAC TCACCTGCGG CAACTGGAGG CGGAAAGCAT CCACATTATT 
CGCGAGGTGG CGGCAGAATT CTCAAATCCG GTGATGCTCT ACTCTATCGG TAAAGATTCC 
AGCGTCATGC TGCATTTGGC GCGCAAGGCG TTTTATCCAG GTACGCTGCC TTTCCCCTTG 
CTGCATGTCG ATACCGGCTG GAAATTCCGC GAGATGTATG AGTTCCGCGA TCGTACGGCG 
AAAGCCTACG GCTGCGAGCT GCTGGTGCAT AAAAACCCGG AAGGCGTGGC GATGGGGATT 
AATCCATTCG TGCACGGCAG CGCGAAACAT ACCGATATTA TGAAGACCGA AGGCCTGAAG 
CAGGCGCTGA ATAAATACGG TTTTGATGCC GCCTTCGGTG GTGCGCGCCG CGACGAAGAG 
AAATCCCGTG CTAAAGAGCG TATCTACTCT TTCCGTGATC GCTTCCATCG CTGGGACCCG 
AAAAATCAGC GCCCGGAGCT GTGGCACAAC TATAACGGGC AGATTAACAA AGGCGAAAGC 
ATCCGCGTTT TCCCGCTCTC TAACTGGACC GAGCAGGATA TCTGGCAATA CATCTGGCTG 
GAAAATATCG ACATTGTGCC GCTGTATCTC GCTGCGGAAC GTCCGGTTCT GGAACGCGAC 
GGTATGTTGA TGATGATTGA TGACAACCGT ATCGACCTGC AACCGGGCGA AGTGATTAAA 
AAACGGATGG TGCGTTTCCG TACGCTGGGC TGCTGGCCGC TGACCGGTGC GGTGGAGTCA 
AATGCACAAA CACTGCCGGA GATCATCGAA GAGATGCTGG TTTCCACCAC CAGTGAACGT 
CAGGGCCGCG TGATTGACCG CGACCAGGCG GGGTCTATGG AGCTGAAAAA ACGTCAGGGG 
TATTTTTAA

Protein sequence

MDQKRLTHLR QLEAESIHII REVAAEFSNP VMLYSIGKDS SVMLHLARKA FYPGTLPFPL 
LHVDTGWKFR EMYEFRDRTA KAYGCELLVH KNPEGVAMGI NPFVHGSAKH TDIMKTEGLK 
QALNKYGFDA AFGGARRDEE KSRAKERIYS FRDRFHRWDP KNQRPELWHN YNGQINKGES 
IRVFPLSNWT EQDIWQYIWL ENIDIVPLYL AAERPVLERD GMLMMIDDNR IDLQPGEVIK 
KRMVRFRTLG CWPLTGAVES NAQTLPEIIE EMLVSTTSER QGRVIDRDQA GSMELKKRQG 
YF