Gene EcSMS35_4030 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4030
Symbol	ade
ID	6142999
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	4117402
End bp	4119168
Gene Length	1767 bp
Protein Length	588 aa
Translation table	11
GC content	54%
IMG OID	641618855
Product	cryptic adenine deaminase
Protein accession	YP_001745993
Protein GI	170680087
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1001] Adenine deaminase
TIGRFAM ID	[TIGR01178] adenine deaminase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	0.377933
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATAATT CTATTAACCA TAAATTTCAT CACATTAGCC GGGCTGAATA CCAGGAATTG 
TTAGCCGTTT CCCGTGGCGA CGCTGTTGCC GATTATATTA TTGATAATGT CTCTATTCTC 
GACCTGATCA ATGGCGGAGA AATTTCCGGC CCAATTGTGA TTAAAGGACG TTACATTGCT 
GGTGTTGGCG CAGAATACAC TGATGCTCCG GCTTTGCAGC GGATTGATGC CCGCGGCGCA 
ACGGCGGTGC CAGGGTTTAT TGATGCTCAC CTGCATATTG AATCCAGCAT GATGACGCCG 
GTCACCTTTG AAACCGCTAC CCTGCCGCGT GGCCTGACGA CCGTTATTTG CGACCCTCAT 
GAAATCGTCA ACGTGATGGG CGAAGCCGGA TTCGCCTGGT TTGCCCGCTG TGCCGAACAG 
GCAAGACAAA ACCAGTACTT ACAGGTCAGC TCTTGCGTAC CCGCCCTGGA AGGCTGCGAT 
GTTAACGGTG CCAGTTTTAC CCTTGAACAG ATGCTCGCCT GGCGGGACCA TCCGCAGGTT 
ACCGGCCTTG CAGAAATGAT GGACTACCCT GGCGTAATTA GCGGGCAGAA TGCGCTGCTC 
GATAAACTGG ATGCATTTCG CCACCTGACG CTGGACGGTC ACTGCCCGGG TTTGGGTGGT 
AAAGAACTTA ACGCCTATAT TGCTGCGGGT ATTGAAAACT GCCACGAAAG TTATCAGCTG 
GAAGAAGGAC GCCGGAAATT ACAACTCGGC ATGTCGTTGA TGATCCGCGA AGGGTCCGCT 
GCCCGCAATC TCAACGCACT GGCAACGTTG ATCAACGAAT TTAACAGCCC GCAATGCATG 
CTCTGTACTG ATGACCGTAA CCCGTGGGAG ATCGCCCATG AAGGACACAT CGATGCCTTA 
ATTCGCCGCC TGATCGAACA ACACAATGTG CCGCTGCATG TGGCATATCG CGTCGCCAGC 
TGGTCGACGG CGCGCCACTT TGGTCTGAAT CACCTCGGCT TACTGGCACC CGGTAAGCAG 
GCCGATATCG TCCTGTTGAG CGATGCGCGT AAGGTCACGG TGCAGCAGGT ACTGGTGAAA 
GGCGAGCCGA TCGATGCACA AACCTTACAG GCGGAAGAGT CGGCGAGACT GGCACAATCC 
GCCCCGCCAT ATGGCAATAC CATTGATCGC CAGCCAGTTT CCGCCAGTGA CTTTGCCCTG 
CAATTTACCC CCGGAAAACG CTATCGCGTT ATTGAGGCCA TCCATAACGA ATTGATTACC 
CACTCCCGCT CCAGCGTCTA CAGCGAAAAT GGTTTTGATC GCGATGATGT GTGCTTTATT 
GCCGTACTTG AGCGTTACGG GCAACGGCTG GCTCCGGCCT GTGGTTTGCT CGGCGGCTTT 
GGCCTGAATG AAGGTGCGCT GGCGGCGACG GTCAGCCATG ACAGCCATAA TATTGTGGTG 
ATCGGTCGTA GCGCAGAAGA GATGGCGCTG GCGGTCAATC AGGTGATTCA GGATGGCGGC 
GGGCTGTGCG TGGTCCGTAA CGGTCAGGTA CAAAGTCATC TACCGTTGCC CATTGCCGGG 
CTAATGAGCA CCGACACGGC GCAGTCACTG GCGGAGCAAA TTGACGCCTT GAAAGCCGCC 
GCCCGTGAAT GCGGTCCGTT ACCCGATGAG CCGTTTATTC AGATGGCGTT TCTTTCTCTA 
CCAGTGATCC CCGCGCTGAA ACTAACCAGT CAGGGGCTGT TTGATGGCGA GAAGTTTGCC 
TTCACTACGC TGGAAGTCAC GGAATAA

Protein sequence

MNNSINHKFH HISRAEYQEL LAVSRGDAVA DYIIDNVSIL DLINGGEISG PIVIKGRYIA 
GVGAEYTDAP ALQRIDARGA TAVPGFIDAH LHIESSMMTP VTFETATLPR GLTTVICDPH 
EIVNVMGEAG FAWFARCAEQ ARQNQYLQVS SCVPALEGCD VNGASFTLEQ MLAWRDHPQV 
TGLAEMMDYP GVISGQNALL DKLDAFRHLT LDGHCPGLGG KELNAYIAAG IENCHESYQL 
EEGRRKLQLG MSLMIREGSA ARNLNALATL INEFNSPQCM LCTDDRNPWE IAHEGHIDAL 
IRRLIEQHNV PLHVAYRVAS WSTARHFGLN HLGLLAPGKQ ADIVLLSDAR KVTVQQVLVK 
GEPIDAQTLQ AEESARLAQS APPYGNTIDR QPVSASDFAL QFTPGKRYRV IEAIHNELIT 
HSRSSVYSEN GFDRDDVCFI AVLERYGQRL APACGLLGGF GLNEGALAAT VSHDSHNIVV 
IGRSAEEMAL AVNQVIQDGG GLCVVRNGQV QSHLPLPIAG LMSTDTAQSL AEQIDALKAA 
ARECGPLPDE PFIQMAFLSL PVIPALKLTS QGLFDGEKFA FTTLEVTE