Gene B21_03491 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_03491
Symbol	ade
ID	8112620
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	+
Start bp	3730409
End bp	3732175
Gene Length	1767 bp
Protein Length	588 aa
Translation table	11
GC content	55%
IMG OID	644849662
Product	hypothetical protein
Protein accession	YP_003001235
Protein GI	251786931
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1001] Adenine deaminase
TIGRFAM ID	[TIGR01178] adenine deaminase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAATT CTATTAACCA TAAATTTCAT CACATTAGCC GGGCTGAATA CCAGGAATTG 
TTAGCCGTTT CCCGTGGCGA CGCTGTTGCC GATTATATTA TTGATAATGT CTCTATTCTC 
GACCTGATCA ATGGCGGAGA AATTTCCGGC CCAATTGTGA TTAAAGGACG TTACATTGCC 
GGTGTTGGCG CAGAATACAC TGATGCTCCG GCTTTGCAGC GGATTGATGC TCGCGGCGCA 
ACGGCGGTGC CAGGGTTTAT TGATGCTCAC CTGCATATTG AATCCAGCAT GATGACGCCG 
GTCACTTTTG AAACCGCTAC CCTGCCGCGC GGCCTGACGA CCGTTATTTG CGACCCTCAT 
GAAATCGTCA ACGTGATGGG CGAAGCCGGA TTCGCCTGGT TTGCCCGCTG TGCCGAACAG 
GCAAGGCAAA ACCAGTACTT ACAGGTCAGC TCTTGCGTAC CCGCCCTGGA AGGCTGCGAT 
GTTAACGGTG CCAGTTTTAC CCTTGAACAG ATGCTCGCCT GGCGGGACCA TCCGCAGGTT 
ACCGGCCTTG CAGAAATGAT GGACTACCCT GGCGTAATTA GCGGGCAGAA TGCGCTGCTC 
GATAAACTGG ATGCATTTCG CCACCTGACG CTGGACGGTC ACTGCCCGGG TTTGGGTGGT 
AAAGAACTTA ACGCCTATAT TACTGCGGGT ATTGAAAACT GCCACGAAAG TTATCAGCTG 
GAAGAAGGAC GCCGGAAATT ACAACTCGGC ATGTCGTTGA TGATCCGCGA AGGGTCCGCT 
GCCCGCAATC TCAACGCGCT GGCACCGTTG ATCAACGAAT TTAACAGCCC GCAATGCATG 
CTCTGTACCG ATGACCGTAA CCCGTGGGAG ATCGCCCATG AAGGACACAT CGATGCCTTA 
ATTCGCCGCC TGATCGAACA ACACAATGTG CCGCTGCATG TGGCATATCG CGTCGCCAGC 
TGGTCGACGG CGCGCCACTT TGGTCTGAAT CACCTCGGCT TACTGGCACC CGGCAAGCAG 
GCCGATATCG TCCTGTTGAG CGATGCGCGT AAGGTCACGG TGCAGCAGGT ACTGGTGAAA 
GGCGAGCCGA TTGATGCGCA AACCTTACAG GCGGAAGAGT CGGCGAGACT GGCACAATCC 
GCTCCGCCAT ATGGCAACAC CATTGCCCGC CAGCCAGTTT CCGCCAGCGA CTTTGCCCTG 
CAATTTACGC CCGGAAAACG CTATCGGGTC ATTGACGTCA TCCATAACGA ATTGATTACG 
CACTCCCACT CCAGCGTCTA CAGCGAAAAT GGTTTTGATC GCGATGATGT GAGCTTTATT 
GCCGTACTTG AGCGTTACGG GCAACGGCTG GCTCCGGCTT GTGGTTTGCT TGGCGGCTTT 
GGACTGAATG AAGGTGCGCT GGCTGCGACG GTCAGCCATG ACAGCCATAA TATTGTGGTG 
ATCGGTCGCA GTGCCGAAGA GATGGCGCTG GCGGTCAATC AGGTGATTCA GGATGGCGGC 
GGGCTGTGCG TGGTACGTAA CGGCCAGGTA CAAAGTCATC TGCCGTTACC CATTGCCGGG 
CTGATGAGCA CCGACACGGC GCAGTCGCTG GCGGAACAAA TTGACGCCTT GAAAGCCGCC 
GCCCGTGAAT GCGGTCCGTT ACCCGATGAG CCGTTTATTC AGATGGCGTT TCTTTCTCTG 
CCAGTGATCC CCGCGCTAAA ACTAACCAGT CAGGGGCTAT TTGATGGCGA GAAGTTTGCC 
TTCACTACGC TGGAAGTCAC GGAATAA

Protein sequence

MNNSINHKFH HISRAEYQEL LAVSRGDAVA DYIIDNVSIL DLINGGEISG PIVIKGRYIA 
GVGAEYTDAP ALQRIDARGA TAVPGFIDAH LHIESSMMTP VTFETATLPR GLTTVICDPH 
EIVNVMGEAG FAWFARCAEQ ARQNQYLQVS SCVPALEGCD VNGASFTLEQ MLAWRDHPQV 
TGLAEMMDYP GVISGQNALL DKLDAFRHLT LDGHCPGLGG KELNAYITAG IENCHESYQL 
EEGRRKLQLG MSLMIREGSA ARNLNALAPL INEFNSPQCM LCTDDRNPWE IAHEGHIDAL 
IRRLIEQHNV PLHVAYRVAS WSTARHFGLN HLGLLAPGKQ ADIVLLSDAR KVTVQQVLVK 
GEPIDAQTLQ AEESARLAQS APPYGNTIAR QPVSASDFAL QFTPGKRYRV IDVIHNELIT 
HSHSSVYSEN GFDRDDVSFI AVLERYGQRL APACGLLGGF GLNEGALAAT VSHDSHNIVV 
IGRSAEEMAL AVNQVIQDGG GLCVVRNGQV QSHLPLPIAG LMSTDTAQSL AEQIDALKAA 
ARECGPLPDE PFIQMAFLSL PVIPALKLTS QGLFDGEKFA FTTLEVTE