Gene EcolC_0034 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0034
Symbol
ID	6068468
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	35635
End bp	37401
Gene Length	1767 bp
Protein Length	588 aa
Translation table	11
GC content	55%
IMG OID	641599438
Product	cryptic adenine deaminase
Protein accession	YP_001723048
Protein GI	170018094
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1001] Adenine deaminase
TIGRFAM ID	[TIGR01178] adenine deaminase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATAATT CTATTAACCA TAAATTTCAT CACATTAGCC GGGCTGAATA CCAGGAATTG 
TTAGCCGTTT CCCGTGGCGA CGCTGTTGCC GATTATATTA TTGATAATGT CTCTATTCTC 
GACCTGATCA ATGGCGGAGA AATTTCCGGC CCAATTGTGA TTAAAGGACG TTACATTGCC 
GGTGTTGGCG CAGAATACGC TGATGCTCCG GCTTTGCAGC GGATTGATGC TCGCGGCGCA 
ACGGCGGTGC CAGGGTTTAT TGATGCTCAC CTGCATATTG AATCCAGCAT GATGACGCCG 
GTCACTTTTG AAACCGCTAC CCTGCCGCGC GGCCTGACGA CCGTTATTTG CGACCCTCAT 
GAAATCGTCA ACGTGATGGG AGAAGCCGGA TTCGCCTGGT TTGCCCGCTG TGCCGAACAG 
GCAAGGCAAA ACCAGTACTT ACAGGTCAGC TCTTGCGTAC CCGCCCTGGA AGGCTGCGAT 
GTTAACGGTG CCAGTTTTAC CCTTGAACAG ATGCTCGCCT GGCGGGACCA TCCGCAGGTT 
ACCGGCCTTG CAGAAATGAT GGACTACCCT GGCGTAATTA GCGGGCAGAA TGCGCTGCTC 
GATAAACTGG ATGCATTTCG CCACCTGACG CTGGACGGTC ACTGCCCGGG TTTGGGTGGT 
AAAGAACTTA ACGCCTATAT TACTGCGGGT ATTGAAAACT GCCACGAAAG TTATCAGCTG 
GAAGAAGGAC GCCGGAAATT ACAACTCGGC ATGTCGTTGA TGATCCGCGA AGGGTCCGCT 
GCCCGCAATC TCAACGCGCT GGCACCGTTG ATCAACGAAT TTAACAGCCC GCAATGCATG 
CTCTGTACCG ATGACCGTAA CCCGTGGGAG ATCGCCCATG AAGGACACAT CGATGCCTTA 
ATTCGCCGCC TGATCGAACA ACACAATGTG CCGCTGCATG TGGCATATCG CGTCGCCAGC 
TGGTCGACGG CGCGCCACTT TGGTCTGAAT CACCTCGGCT TACTGGCACC CGGCAAGCAG 
GCCGATATCG TCCTGTTGAG CGATGCGCGT AAGGTCACGG TGCAGCAGGT ACTGGTGAAA 
GGCGAGCCGA TTGATGCGCA AACCTTACAG GCGGAAGAGT CGGCGAGACT GGCACAATCC 
GCTCCGCCAT ATGGCAACAC CATTGCCCGC CAGCCAGTTT CCGCCAGCGA CTTTGCCCTG 
CAATTTACGC CCGGAAAACG CTATCGGGTC ATTGACGTCA TCCATAACGA ATTGATTACG 
CACTCCCACT CCAGCGTCTA CAGCGAAAAT GGTTTTGATC GCGATGATGT GAGCTTTATT 
GCCGTACTTG AGCGTTACGG GCAACGGCTG GCTCCGGCTT GTGGTTTGCT TGGCGGCTTT 
GGACTGAATG AAGGTGCGCT GGCTGCGACG GTCAGCCATG ACAGCCATAA TATTGTGGTG 
ATCGGTCGCA GTGCCGAAGA GATGGCGCTG GCGGTCAATC AGGTGATTCA GGATGGCGGC 
GGGCTGTGCG TGGTACGTAA CGGCCAGGTC CAAAGTCATC TGCCGTTGCC CATTGCCGGC 
CTGATGAGCA CCGACACGGC GCAGTCGCTG GCGGAACAGA TTGACGCCTT GAAAGCCGCC 
GCCCGTGAAT GCGGTCCGTT ACCCGATGAG CCGTTTATTC AGATGGCGTT TCTTTCTCTG 
CCAGTGATCC CCGCGCTAAA ACTAACCAGT CAGGGGCTAT TTGATGGCGA GAAGTTTGCC 
TTCACTACGC TGGAAGTCAC GGAATAA

Protein sequence

MNNSINHKFH HISRAEYQEL LAVSRGDAVA DYIIDNVSIL DLINGGEISG PIVIKGRYIA 
GVGAEYADAP ALQRIDARGA TAVPGFIDAH LHIESSMMTP VTFETATLPR GLTTVICDPH 
EIVNVMGEAG FAWFARCAEQ ARQNQYLQVS SCVPALEGCD VNGASFTLEQ MLAWRDHPQV 
TGLAEMMDYP GVISGQNALL DKLDAFRHLT LDGHCPGLGG KELNAYITAG IENCHESYQL 
EEGRRKLQLG MSLMIREGSA ARNLNALAPL INEFNSPQCM LCTDDRNPWE IAHEGHIDAL 
IRRLIEQHNV PLHVAYRVAS WSTARHFGLN HLGLLAPGKQ ADIVLLSDAR KVTVQQVLVK 
GEPIDAQTLQ AEESARLAQS APPYGNTIAR QPVSASDFAL QFTPGKRYRV IDVIHNELIT 
HSHSSVYSEN GFDRDDVSFI AVLERYGQRL APACGLLGGF GLNEGALAAT VSHDSHNIVV 
IGRSAEEMAL AVNQVIQDGG GLCVVRNGQV QSHLPLPIAG LMSTDTAQSL AEQIDALKAA 
ARECGPLPDE PFIQMAFLSL PVIPALKLTS QGLFDGEKFA FTTLEVTE