Gene Emin_1000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_1000
Symbol
ID	6262823
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	+
Start bp	1089863
End bp	1091071
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	45%
IMG OID	642611480
Product	aromatic hydrocarbon degradation membrane protein
Protein accession	YP_001875890
Protein GI	187251408
COG category	[I] Lipid transport and metabolism
COG ID	[COG2067] Long-chain fatty acid transport protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.768268
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.00646641
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAATTTA AAATATTAAA AAAAGCATTA TTATGTTTAA TGCCGTTTTG CTGTGGAATT 
TATTTAAACG CGGCGGGATT CGCGCTTTAT GAATTCAGCG CAAGGGGCAA CGCCATGGGC 
GGCGCCGTAC TGGCAAACAA AGCGGAACCC GCCTCCATAG CTTCAAACCC CGCTCTTATC 
ACACAATTAG AAGGTGCCCA AATACAAGCG GGCGTAACAG CCATTATAGT TGAAGGTTCA 
ACCTCGTTAA ACAATGATAA AAGAGATTTA GAAACAGGCG TTTTTTACCT GCCGACCTTC 
TATTTTACCA AGCAAATGAG AGAACATATA GTCTTAGGCG TGGGTTTCTT TTCACGCTTT 
GGGCTTGGCG GCAAATATAA AGATTACGGC ACCTGGCTGC CCGCGATATC GGAAAGACAG 
TCCTACAGAA TGGATTTGGT AACATACTCC TTTAACCCGG TTATGGCTTC CCAAGTAACG 
GACGAGCTTT CTTTAGCAGG CGGTTTTGAA ATTATGTACG CCAGTTTAAC AGAGGAAAAA 
GGCCCCGGCA ACGCAAACAG AATTGAAATT GAAGGTGATT CCATAACCTG GGGCGCTAAC 
TTCGGCCTTC ATTATAAGCC CGAATGGGCT GATAAATGGG CCGCCGCCGT TACTTACCGC 
ACAAAAACAA GACATTTGGC CAGCGGAAAG GTAACGGGAC ACGGTTTATA CAGCCCCGCC 
ACGGGCGACG CTACCGCCGC GCTCGCTTTG CCTGATCAGC TAGCTTTCGG CCTTTCGTTT 
ACACCTACAG AAAGGCTTAT TCTTGAAGCG GGCATCACCG GCGTGTTTTG GAGTTCTTAT 
AAACAGCTTA AAATCGATTA TGACGATTTG TCAAAAGGAT CTTCAAACGA GTATAAGCAT 
TATAGGGACG TTTTCCGCCT TTCTTCCGGC ATGGAATTTG CGGTAACAGA AAATTGGGAT 
ATACGTTTTG GTTATGTATA TGACGAATCC CCCATTAACC CTGATTTTAT GGATACAATG 
GTACCCGCGG ATGACAGGCA TATCTTCAGC ACGGGTTTAG GTTATAAAAG AAGCAACTGG 
GGCGCGGATA TATCCTATTC TTATATGTAT GTAAAAGATT TATCCGGTAC TACGGAACAC 
GGCACCCCCG CGAAATATGA AAACGCCCGA AGCCAAATGA TAGGCCTAAG TTTAAAGTAC 
GCGTTTTAA

Protein sequence

MKFKILKKAL LCLMPFCCGI YLNAAGFALY EFSARGNAMG GAVLANKAEP ASIASNPALI 
TQLEGAQIQA GVTAIIVEGS TSLNNDKRDL ETGVFYLPTF YFTKQMREHI VLGVGFFSRF 
GLGGKYKDYG TWLPAISERQ SYRMDLVTYS FNPVMASQVT DELSLAGGFE IMYASLTEEK 
GPGNANRIEI EGDSITWGAN FGLHYKPEWA DKWAAAVTYR TKTRHLASGK VTGHGLYSPA 
TGDATAALAL PDQLAFGLSF TPTERLILEA GITGVFWSSY KQLKIDYDDL SKGSSNEYKH 
YRDVFRLSSG MEFAVTENWD IRFGYVYDES PINPDFMDTM VPADDRHIFS TGLGYKRSNW 
GADISYSYMY VKDLSGTTEH GTPAKYENAR SQMIGLSLKY AF