Gene Emin_0454 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_0454
Symbol
ID	6262593
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	+
Start bp	489725
End bp	491296
Gene Length	1572 bp
Protein Length	523 aa
Translation table	11
GC content	43%
IMG OID	642610925
Product	hypothetical protein
Protein accession	YP_001875348
Protein GI	187250866
COG category	[I] Lipid transport and metabolism
COG ID	[COG2267] Lysophospholipase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.00000000520171
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAATAAAA AAATCTTTAA GCTTGTTAAA TATACGGTTA TAATTTTTAT AGTATTGTTT 
TTTCTGTTGC TTGCAGGAGT TGCTTTACGT CTGCATTATG TGCCTGATTT GCAGCCGTGG 
CATACATTTG CGCCTAATGA ACTGACCGTC AAGGAATTGG AAAAAGCCAC ATGGCAAGAT 
TACACCGCCC GTGAAAACAA AATATTTGAA GAAGTTCATA AGAACGTAAT TTTAAAAACG 
CCCGAAAGCG AGCAAAACCA AATCAACCGT TATTTCAAAG GCAGTAAAAT ATATCCCGGC 
AATTTTAAGC AAGACTGGAA CCGTTCTTAT CTTTTAATAC CGGAAAATCC TAAAGGGGCG 
GTTGTTTTAA TACACGGCCT TACGGATACT CCTTACAGCC TGCGTCATAT AGCGGAGATA 
TATTATAAAA AAGGCTTTGT TGCGGTGGGG TTAAGGGTTC CCGGGCACGG TACGGTGCCT 
GGCGCGCTTA CCAAAAGCGT TTGGCAGGAT TGGGCCGCTG CTACCAAATT CGCGGTAAAG 
GAAGCCAAAA AGCTTACGCC GGAGGGGGCG CCTCTTCACA TAGCGGGTTT TTCACAAGGC 
GGCGCGCTTG CCGTAAAATA CGCGTTGGAC GCGCTTGAGG ATGACTCTCT TATAAGGCCT 
GACAGACTGG TTCTAATTTC TCCCATGATA GGTATTACAA GGCTTTCCAA ACTGGCCGAG 
ATACTTGCCA TTCCATCAAT GCTTCCAGGG TTTGAAAAAG CCGCGTGGAT CAGTATTATT 
CCCGAGTTTA ACCCTTTTAA ATACAACTCT TTTCCTGTTA ATGCGGTTAA ACAGGCCCGT 
CTTTTAATTG CGGATGTGAA AAGGCAAGCC ATAAGGCTTG GGCAAAAAGA TATGTTAAAG 
GAGCTTCCGC CTATAATTAC ATTTCAGTCA ATAGCGGATT ACACGGTCAG TACTCCCGCT 
ATTATAAATG ACCTTTATAG CAATCTGCCG GAAAATGAAA GTGAGTTGGT TTTGTTTGAT 
ATTAACCGCG ATACAGCGTT TTTACCGTTG GTGCGTCCTG TTTTTGTTAA TATGATGTCA 
ATAATGTTAC CGGGATTTCC GCAAAAATAT AAGATAACTG TAATAGGCAA CTCCGGCCCC 
AATGATTCAG GCGCGGTAGA GCGCAGCGTC GAGCCCGGCG GAGTGGATTT TAAAACAAGA 
GCGTTGGGTC TGGTTTATCC TAAAGAGTTG TTTTCTCTTT CTCATATTTC GCTTCCTTTT 
CCGGAAACTG ACCCGTTATA CGGCTCTATT CCTGACCCGG AAATAAAAGA TGCTTTTGGC 
ATAAATCTGG GCCTTATATC AAACGCGCAG GGAGAACGCG GCGTTTTGGG AATAAACACC 
AATTTATTTT TCAGAGTTTC ATCAAACCCT TTGTTTTCCT ATATTACCGC ACGCATAGAA 
GACATTATTG ACACCTTTCC CCAGGAGACG GAAAAGACAT CCGCAGGGGC GTCTGCTTCT 
AAATCTAAAA TTACGCAAAA ACAATACGGC GATATTATGA AAGCCGCTGA TTATAAAGAT 
GAGCCTTTTT AA

Protein sequence

MNKKIFKLVK YTVIIFIVLF FLLLAGVALR LHYVPDLQPW HTFAPNELTV KELEKATWQD 
YTARENKIFE EVHKNVILKT PESEQNQINR YFKGSKIYPG NFKQDWNRSY LLIPENPKGA 
VVLIHGLTDT PYSLRHIAEI YYKKGFVAVG LRVPGHGTVP GALTKSVWQD WAAATKFAVK 
EAKKLTPEGA PLHIAGFSQG GALAVKYALD ALEDDSLIRP DRLVLISPMI GITRLSKLAE 
ILAIPSMLPG FEKAAWISII PEFNPFKYNS FPVNAVKQAR LLIADVKRQA IRLGQKDMLK 
ELPPIITFQS IADYTVSTPA IINDLYSNLP ENESELVLFD INRDTAFLPL VRPVFVNMMS 
IMLPGFPQKY KITVIGNSGP NDSGAVERSV EPGGVDFKTR ALGLVYPKEL FSLSHISLPF 
PETDPLYGSI PDPEIKDAFG INLGLISNAQ GERGVLGINT NLFFRVSSNP LFSYITARIE 
DIIDTFPQET EKTSAGASAS KSKITQKQYG DIMKAADYKD EPF