Gene Ent638_1033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_1033
Symbol
ID	5113980
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	+
Start bp	1135491
End bp	1137119
Gene Length	1629 bp
Protein Length	542 aa
Translation table	11
GC content	51%
IMG OID	640491209
Product	NUDIX hydrolase
Protein accession	YP_001175766
Protein GI	146310692
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1051] ADP-ribose pyrophosphatase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0906744
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCAATTT TCGCTAGCGG TATCATGTTC CGTAACGGGA AGAAGGTCTT TCTGATTCAG 
CGATCTGACG ACGGAACATG GTGCCCACCT GGCGGCAAGC TGGAGCCAAA CGAGATAGCA 
GGTGATGCTG CGCGCAGAGA GGTGATGGAA GAGGCTGGGT ATCGATATGA CGGTCCAATG 
ACCCCTTATA GCGTATCCGG TGACTACCTT ACCTTCCGTG CTGATGTTGA TGAGCAGTTC 
GAAGCAACTA TCAACGATGA ATCACTTGAT TCCGGGTGGT TTCACATCGA TGACCTGCCC 
AAGCCACTGC ATCAACCTTT CGCTGAAGTA TTGGCCCAGC AAGCACTCAA CGAAACTCAA 
GTGGCGTCAC TCATCGCTGA TGGAACGCTA AGCAGCCCTC AATTCTTTAT AAACATGTGG 
ATGTACGCCA TTCGAGTAAC CGGGACAGGG GTTACATGGC GATCTGCAGA TCAACAAATG 
GCCTTCCGCA ACCCGGATGA CTATTTGACC CCCGAATTTC TTCAGAGAGT AGCCGGTGTC 
CCCCTTATCT GGCTGCACCC TGAGAGAAAT AAACTCGACA GCGATGAATT TGCTAAGCGC 
GTGATTGGCA CCCTGACAAA CAGTTGGGTT GCCGACAATG GCGAGGTGTG GGCTATTGCC 
CGAGTTTATG ACGCTGAAGC CGCTGAAATA ATGGCGACAA AGCAATTAAG CACCTCTCCA 
ACCGTCACGT TTAGTGAAGT ACCCGATTCA ATCATCAAAG TCGATGGTCA GCCTCTATTG 
GTGGAAGGTT CCCCGGTATT GCTCGACCAC GTTGCTGTTT GTGAACAGGG CGTATGGGAC 
AAGCTCCTTG ACCCTACTGG TGTTAAATCT GATTCCGTTC CTAATGAGGC TGAAAAAATG 
GACGAGGAAA AAATCGTAGC GCTAATCAAT AAAGCGATTG ACGCACGCAT GGCTAAGGCA 
GACTCCGAAG ACAAGGACGC CAAGGCTAAG GCTGATGCTG AAGAGGCTGA TAAAAAAGCC 
AAAGCAGACG CCGAAGATAA AGAGGCAGAA GAAGCCAAAG CCAAGGCCGA CGCAGAAGAA 
AAGTCAGCCA AGGAAAAAGC AGATTCAGAG GCCAAAGAAA AGGCTGATGC TGAAGCGAAA 
GAGGCAGAAG AAAAAATGGC AAAAGACAAA GCTGATTCAG AACTGCGTCG TGAAATCGCC 
GATCTCAAAT CCCGCATCCC AACCGAACTG TCTGATGAAG AACGTAACGA AGTCGCTGAC 
TCTCAAGTCA AGGCAGACAG CGTGTTCTCA AGCTTCGGTA AACGTGCGCC GGTGCCACTT 
TCTGGCGAGA AGCCAATGGC ATACCGCCGC CGCCTGATGG TTCAGTTGCA GGAGCATTCA 
CCTGACTTTA AGTCTGTTGA TTTGTCTTCA ATTGCTGACT CAGCCCTTCT CGGTTTCGCT 
GAAAAACAGA TTTATGCAGA CGCTCAAAAG TCGGCAAGTC TGTCAGTGGG CCCAGGCATG 
CTGCGTGAAA TTAAGCGCGC TGATGCTACC GGTCGTCAAA TCAGCACATT CGAAGGCGAT 
CCCGCTGCTA CCTGGGCACC ATTCCAGTTG GGCAAGCGCC AGATTACCAG CATCAATAAC 
CAGGCTTAA

Protein sequence

MAIFASGIMF RNGKKVFLIQ RSDDGTWCPP GGKLEPNEIA GDAARREVME EAGYRYDGPM 
TPYSVSGDYL TFRADVDEQF EATINDESLD SGWFHIDDLP KPLHQPFAEV LAQQALNETQ 
VASLIADGTL SSPQFFINMW MYAIRVTGTG VTWRSADQQM AFRNPDDYLT PEFLQRVAGV 
PLIWLHPERN KLDSDEFAKR VIGTLTNSWV ADNGEVWAIA RVYDAEAAEI MATKQLSTSP 
TVTFSEVPDS IIKVDGQPLL VEGSPVLLDH VAVCEQGVWD KLLDPTGVKS DSVPNEAEKM 
DEEKIVALIN KAIDARMAKA DSEDKDAKAK ADAEEADKKA KADAEDKEAE EAKAKADAEE 
KSAKEKADSE AKEKADAEAK EAEEKMAKDK ADSELRREIA DLKSRIPTEL SDEERNEVAD 
SQVKADSVFS SFGKRAPVPL SGEKPMAYRR RLMVQLQEHS PDFKSVDLSS IADSALLGFA 
EKQIYADAQK SASLSVGPGM LREIKRADAT GRQISTFEGD PAATWAPFQL GKRQITSINN 
QA