Gene Emin_1504 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_1504
Symbol
ID	6263793
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	+
Start bp	1596355
End bp	1597536
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	39%
IMG OID	642611992
Product	hypothetical protein
Protein accession	YP_001876389
Protein GI	187251907
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.000468012
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAGAAAA TTTTAAGTAT ATTTTTTCTT ACTTTGTGCG TGTCCTTATT CGCGCAAGAC 
AAGAAAGATA TTGAAAAAGA CATTATCAAA TATGGCGGCG CGGGCATACG CGCGGTCTAT 
AACCTGGACT TTCCTACCGC ACAAAAAAAT ATAGATATCG CTTTTCAAAA ATACCCCAAC 
CACCCGTACG CTCATTTTGG CAACATGCTT ATAGCCTGGG GAAGGTTTAC TTATGAATTT 
GAAAAAAGCG ACCCGGAACA GAAAAAGATT TTTGAGTCAG TCCTTTCCTC TTCCATAAAC 
GGGATTAACA TTTGGCTTAA GGATAACCCA AAAGATCCAA CCGCCTTTAT GGCCCTGGGC 
GGAGCATACG GGTTAAAAGG CATGTTCGCT ATGGACAACA AAAACTGGGT TACGGCATAT 
TTTTCAGCCA AAAAGGGAAT AAGTTATATG CGAAAAGCGC TTGAAGCGGA CCCGGAATTT 
TATGACGCCT ACTTCGGCCT TGGCATATAT GAATATTACA CGGGCACGCT GCCTTCCGTA 
ATTAAAGTTT TGGCTAAAAT AGTGGCTATA AAAGGGAATC AGACAAAAGG CATTGAATAT 
TTAAATATTT CCAAAGAAAA AGGACAGTTC ACCTCTGACT CTTCAAAACT TATGTTAGTT 
GAAATATATA ATAACAGGCT TTCACAGTTT TATAACCCGC AAGAATCACT TATGTATATA 
AGAACTGTTT CCAACAAATA TCCGGCAAAT CCGCTTATGC CTTTTGTTGA AATTATAACG 
GAATTTGAAA ATAAAAACTA TGATATTGTC ATTAAAAAAG CCAAGACTTT TATAAATAAA 
ATAGGCGCTG CTCCTTTCTA TACAACTATG TATATTCCCC GTTCGTATAC CGCTATAGGC 
ACGGCGCAAA TGGCTAAGGG AGAATGGGAA CAGGCATTAA AAACATTTGA AAACGCCAAA 
GCTATTTCTT TTAACAAAAG TGAACCTACC AGATGGGCGG TTTGGAATTT AATAAGATTA 
GGACAGTGCT ATGACGCATT AGGGCAAAGG GAAAAAGCCT TATCCACATA TAGAATGGTA 
ACAGCTATGC CAAACACCTG GGAGCTTAAT GACGAGGCTA AAAAATTTAT AAAAACCCCG 
TTTACCAAAG AAACCGCGCT CGGCCCGCTG CCCCCTCTTT AA

Protein sequence

MKKILSIFFL TLCVSLFAQD KKDIEKDIIK YGGAGIRAVY NLDFPTAQKN IDIAFQKYPN 
HPYAHFGNML IAWGRFTYEF EKSDPEQKKI FESVLSSSIN GINIWLKDNP KDPTAFMALG 
GAYGLKGMFA MDNKNWVTAY FSAKKGISYM RKALEADPEF YDAYFGLGIY EYYTGTLPSV 
IKVLAKIVAI KGNQTKGIEY LNISKEKGQF TSDSSKLMLV EIYNNRLSQF YNPQESLMYI 
RTVSNKYPAN PLMPFVEIIT EFENKNYDIV IKKAKTFINK IGAAPFYTTM YIPRSYTAIG 
TAQMAKGEWE QALKTFENAK AISFNKSEPT RWAVWNLIRL GQCYDALGQR EKALSTYRMV 
TAMPNTWELN DEAKKFIKTP FTKETALGPL PPL