Gene Ent638_3801 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_3801
Symbol
ID	5110845
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	-
Start bp	4097445
End bp	4098725
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	54%
IMG OID	640494010
Product	hypothetical protein
Protein accession	YP_001178507
Protein GI	146313433
COG category	[S] Function unknown
COG ID	[COG3266] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.355591
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATGAAT TCAAACCAGA AGACGAGCTG AAACCCGATC CCAGCGATCG TCGTACTGGT 
CGTTCTCGTC AATCTTCAGA ACGCGATAAT GAGCCGCAAA TCAACTTTGA TGATGTTGAT 
TTGGATGCAG ACGATCGTCG TCCGTCACGT AGTCGCCCTG CGCGCGATGA GCGGGAAGAA 
GAGGATTATG AGTCTGATGA TGAATCACTA GACGAAGAGC CTCTAGAGCG TCGCCCGCGC 
AAACGTAAAA AAGTAGCGGC GAAACCCGCT TCACGTCAGT ACGTTATGAT GGGCCTTGGC 
GTTTTTGTCC TGCTGCTGCT GATTATCGGC ATCGGTTCTG CGCTGAAAGC ACCGTCTACC 
CCCTCAAATG AGCAGACCGC TTCAACCGAA AAGAGCATCA ATCTTTCGGG CAATAATAAT 
GATGCAGCTG ATCAGGCTAA TGGTGCGCAA CCTGCGCCAG GCACCACTTC TGCTGAACAG 
ACCGCGGGCA ATCCAACGAA TGCGCCGCAG GATGTCTCCC TGCCACCCGT TTCGGCTACG 
CCAACTCAGG GCCAGGCAAG CGCGGCACCT GAAGGTCAGC AGCGTGTTGA AGTTCAGGGC 
GATCTGAATA ATGCGCTTAC GCAGAACCCG GATCAGGTGA ATAACGTGGT GGCTAATTCC 
ACGCTGCCAA CTGAACCTGC AACTGTCGCG CCAATTCGTG GCGGGAATGC TCAACCGCAA 
ACCGCGGCAA CGGAAACCAA ACCGCGTCAA ACTCAGGCTG CCACTTCGCG TCCAGAGCGT 
CAAAAAGCGG TGATTGAGCC GAAGCGCGAA ACGAAACCGC AGGCCGTTGC TAAAGCGACT 
GAAGCCAAAC CGGTTGCCCA GCCTAAGCCA ACGGAAACCG CGACCAGCGC GCCGGTGAAA 
ACACCAGCGG CCACAGCAGC ACCGAAAGTG ACTGCAGCAA CACCGACTCC TGCAGCGACG 
GCAACAGCGC CTGGCACTGC ATCAGGTAAG TCTGCGGGTA ACGTTGGGGC AATGAAGGCT 
GCACCGTCTA ATAATTACAC GCTTCAGTTG AGCAGTTCGT CTAACTACGA CAATCTGAAT 
AACTGGGCGA AGAAATCGAA CCTGAAAAAC TATGTGGTTT ATCAGTCGAC TCGCAACGGA 
CAGCCATGGT ACACGCTGGT TAGCGGCGTT TACGCCTCTA AAGACGAAGC GAAACGCGCT 
GTGGCAACGT TACCTGCTGA CGTTCAGGCG AAAAACCCAT GGGCGAAACC GATTCATCAG 
GTTCAGGCCG ACTTGAAGTA A

Protein sequence

MDEFKPEDEL KPDPSDRRTG RSRQSSERDN EPQINFDDVD LDADDRRPSR SRPARDEREE 
EDYESDDESL DEEPLERRPR KRKKVAAKPA SRQYVMMGLG VFVLLLLIIG IGSALKAPST 
PSNEQTASTE KSINLSGNNN DAADQANGAQ PAPGTTSAEQ TAGNPTNAPQ DVSLPPVSAT 
PTQGQASAAP EGQQRVEVQG DLNNALTQNP DQVNNVVANS TLPTEPATVA PIRGGNAQPQ 
TAATETKPRQ TQAATSRPER QKAVIEPKRE TKPQAVAKAT EAKPVAQPKP TETATSAPVK 
TPAATAAPKV TAATPTPAAT ATAPGTASGK SAGNVGAMKA APSNNYTLQL SSSSNYDNLN 
NWAKKSNLKN YVVYQSTRNG QPWYTLVSGV YASKDEAKRA VATLPADVQA KNPWAKPIHQ 
VQADLK