Gene Ent638_3990 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_3990
Symbol
ID	5110451
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	+
Start bp	4324182
End bp	4325381
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	56%
IMG OID	640494204
Product	putative protoheme IX biogenesis protein
Protein accession	YP_001178696
Protein GI	146313622
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG3071] Uncharacterized enzyme of heme biosynthesis
TIGRFAM ID	[TIGR00540] hemY protein

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00160322
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.165471
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTAAAG TTCTCTTCCT CTTCTTATTG TTGATCGCCG GGATCGTACT GGGGCCAATG 
CTTGCGGGCC ATCAAGGCTA CGTGCTGATC CAGACCGATA ACTACAATAT CGAAACGAGC 
GTCACGGGCC TGGTGATCAT CTTGATCCTC ACCATGGTGG CGCTGTTCGC CATCGAATGG 
ATCCTGCGCC GTATTTTCCG CACGGGCGCA CATACCCGCA GCTGGTTTGT TGGCCGCAAA 
CGCCGTCGTG CACGCAAGCA GACCGAACAG GCGCTGCTGA AACTGGCTGA AGGCGATTAT 
CAGCAAGTTG AAAAGCTGAT GACCAAAAAC GCCGATCACG CTGAGCAGCC GGTGGTTAAC 
TATCTGCTAG CCGCAGAAGC CGCCCAGCAG CGCGGCGATG AAATGCGTGC CAATCAGCAT 
CTTGAGCGCG CGTCCGAACT GGCTTCTAAC GACCAGATTC CAGTTGAAAT TACACGCGTG 
CGTCTGCAAC TGGCGCGAGG TGAAAACCAC GCAGCGCGTC ACGGTGTTGA CCGTCTGCTG 
GAAATCACGC CACACCATCC GGAAGTGCTG CGTCTGGCAG AGCAGGCTTA TATCCGCACC 
GGCGCCTGGG GTTCATTGCT GGATATTATT CCTTCTATGG CAAAAGCCGA CGTGGGTGAT 
GATGAACACC GTGATGCGCT GCAGCGTCAG GCGTGGATTG GCCTGATGGA TCAGGCGCGG 
GCCGATCTGG GTAGCGACGG TCTGAAAACC TGGTGGAAGA ATCAGAGCCG TAAAACGCGC 
CAGCAAGTTC CATTGCAGGT GGCGATGGCA GAACATCTCA TCGAATGTGA CGATCATGAC 
ACCGCGCAGG CGATCATTCT TGATGGCTTG AAGCGTCAGT ATGACGATCG TCTGGTGATG 
GTGATCCCGC GTCTCAAGAC CAACAATCCT GAGCAGATGG AAAAAATGTT ACGCCAGCAG 
ATCAAGACGG TGGGCGATCG TCCGCTGCTA TGGAGCACGC TGGGTCAGTC GCTGATGAAG 
CACGGCGAAT GGCAGGAGGC GAGCCTCGCT TTCCGCGCTG CGTTGAAACA GCGCCCGGAT 
GCGTTTGATT ATGCATGGCT TGCCGACTCG CTGGACAAAC AGCACAAGCC AGAAGAAGCC 
GCGGCGATGC GTCGTGATGG CCTGCTGCTC ACCTTGCAGA ATAACGGCAG TCAGGTGTAA

Protein sequence

MLKVLFLFLL LIAGIVLGPM LAGHQGYVLI QTDNYNIETS VTGLVIILIL TMVALFAIEW 
ILRRIFRTGA HTRSWFVGRK RRRARKQTEQ ALLKLAEGDY QQVEKLMTKN ADHAEQPVVN 
YLLAAEAAQQ RGDEMRANQH LERASELASN DQIPVEITRV RLQLARGENH AARHGVDRLL 
EITPHHPEVL RLAEQAYIRT GAWGSLLDII PSMAKADVGD DEHRDALQRQ AWIGLMDQAR 
ADLGSDGLKT WWKNQSRKTR QQVPLQVAMA EHLIECDDHD TAQAIILDGL KRQYDDRLVM 
VIPRLKTNNP EQMEKMLRQQ IKTVGDRPLL WSTLGQSLMK HGEWQEASLA FRAALKQRPD 
AFDYAWLADS LDKQHKPEEA AAMRRDGLLL TLQNNGSQV