Gene Mlg_2113 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2113
Symbol
ID	4269363
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	2399620
End bp	2400714
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	66%
IMG OID	638126869
Product	aromatic hydrocarbon degradation membrane protein
Protein accession	YP_742945
Protein GI	114321262
COG category	[I] Lipid transport and metabolism
COG ID	[COG2067] Long-chain fatty acid transport protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.628404
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.519362
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGCAGCT ATATCCTGCC CGAGTTCGAG TACGAATCGG ATGACCCCAC CGCCGGCAAC 
CCCTACCCCG GGGACCACTC CAGCAGGAGC CGGGAGGCCG CCTTCGTGCC GGTGGGTTAC 
GCCGCCTGGG AACTGCGGGA CGATATCCGC ATGGGCGTCG GGGTGACGGT GCCCTACGGG 
CTGGAGACCG ACTATGACCG CGACTGGATC GGCCGCTACG ACGCCATCAA CACGGAGTTG 
CTGACCATCG ACATTAACCC CACCGTCGCC TGGCGGGTCA ATGAACAGTT CGCCGTGGCC 
GCGGGGCTGT CCGCACAGTA CGCCGACGCC AGCCTCAGCA GCGCCATACC CGGTCAGGGG 
ATGGACCCCT CGACCGACGG CAAGCTCGAC GTGGAGGGGG ACAATTGGGC CTATGGCTTC 
AACCTGGGGG CCCTGTTCGA ACCGGTCGAG GGGACCCGCC TCGGGGTGGC CTACCGCTCG 
CGCATCACCC ATGACCTTTC GGGGGATGCC GAGTACGACC CGGCGAACTT CGGCCCGGGC 
ACCGCCGAGC CCCAGGAGGT CGGGGGGAGC GCCAAACTGC GCCTGCCCGA GACCCTCAGT 
CTGGGCATCC ACCAGGCGAT CAACGACCGC TGGGCGGTGA TGGCCGACGC CACCTGGACC 
CGCTGGAGCC GCTTCGATGA GCTACGGGTG GATTTCGACG AGGACATCAC CATCGGCACC 
ACCCTGATGG GGCCGATCAC CTCCTCCGGC AGCGTCGACG ACTACAGCTG GGACGACACC 
TGGTTCGTCG CCCTGGGCGC CACCTTCCGT CCCAACAACG AATGGGCACT GCGGGTCGGG 
GTGGCCCACG ACGAAAGCCC GGTCAGCAAC TGCTGCCGCA CCCCGCGCAT CCCGGACGAG 
GACCGCACCT GGCTGGCCTT CGGCGCCAGC TACCAGCCCA ATGACAACGT GAAACTGGAC 
TTTGGCTACA CCTACATCTG GCTGGACGAC GCCGATATCG TGCTGAACGA CGACAACCCC 
AATGTCCCGG ACGTGGAGGG CGAGTACGAA AGCTCTGTGC AGATCCTCAC CGCCTCATTC 
AACTACCGGT TCTGA

Protein sequence

MGSYILPEFE YESDDPTAGN PYPGDHSSRS REAAFVPVGY AAWELRDDIR MGVGVTVPYG 
LETDYDRDWI GRYDAINTEL LTIDINPTVA WRVNEQFAVA AGLSAQYADA SLSSAIPGQG 
MDPSTDGKLD VEGDNWAYGF NLGALFEPVE GTRLGVAYRS RITHDLSGDA EYDPANFGPG 
TAEPQEVGGS AKLRLPETLS LGIHQAINDR WAVMADATWT RWSRFDELRV DFDEDITIGT 
TLMGPITSSG SVDDYSWDDT WFVALGATFR PNNEWALRVG VAHDESPVSN CCRTPRIPDE 
DRTWLAFGAS YQPNDNVKLD FGYTYIWLDD ADIVLNDDNP NVPDVEGEYE SSVQILTASF 
NYRF