Gene Mlg_2397 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2397
Symbol
ID	4269394
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	2722741
End bp	2723799
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	65%
IMG OID	638127155
Product	WD40 domain-containing protein
Protein accession	YP_743227
Protein GI	114321544
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG0823] Periplasmic component of the Tol biopolymer transport system
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.00000884296
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGAGTAAGC GCAAACAAGG GTGGTTGGGC CTCCTGGTCG GGCTCATGGT CCTGCCGGGT 
ATGGCCCTGG CGGCGGACGA TAAGCCTGAT GACGCGGCCG TGCTCTTCGT CTCCAACCAG 
GAAGGGGCAC AGAGCATCTA CTCGGCCAGT CTTAATGATG GCGCGATTGT CCGGTTGACC 
GATCCGGCCC ACTCCGACAT GGACCCGCGC TGGTCGCCTG ACCGCCAGCG GATTGCCTTT 
GTCTCCCGGC GGGACGGCAA CGGCGATATC TACCTGATGG ACGCAGACGG CAGCAACCAG 
CAACGTCTCA CCCACAGCGA GCGCATGGAC TTCATGCCCC AGTGGCACCC CTCCGGCGAT 
TATCTCGCCT TCACCTCCAG CCGGGTCAGT CCGCGCGGGG TCTTCCTACT GGACCTGGCC 
ACCGGGGAGG CGCGGTTGCT CAGCGAGGCG GTGCGTTCTC CGGAGGCCCT GCGTTGGTCG 
CCGGATGGGG GGCAGTTGGC TGTCATCGCG CGGCCCGGGG GCGAGGGTGG CAATGCCATC 
ATGGTGATCG ATCTTGAGGA CGACGGGCAC AGTATCCTGG TGCCCAATGA CCGGCATGCC 
GGGAATGTGC AGTCCCTCGC CTGGCACCCC AGCGGCGATT ACCTGGCCTA TACCGCCTCC 
ACCGATAACC GCCGCGAGGT GCAACTTTAC GTGTTGCACG TTCAGGAGGG CCACTCGGAG 
CAGGTCGCGT CCGCCCCGGG CAACGTACGG GGTTTCCCGG TTTGGTCCAC CGACGGGGAC 
TGGCTCGTCT ATGCCTCCAC GGCGACCCCC GCTCCGGAGG AGACCAAGAC CAATATCTAC 
GCCTCCCGCT TCCCCGATGA CGGCCGACCG GTAACGGTCG CCACCCTTGA CGGACAGCTG 
GCTCAGCCGG TCTGGCTGCC AAATGATGGG GGGGAGGTTG TCTTCGTGTC GCAAAAGGGC 
GGTGCAGCGG AATTGTTTCG CGGTCGGGTC GATGGTGCGG AGCCGTCGCT GGTGTTTGCG 
CAGCCCGCAT ACATGCATTC GCCCCGCACA GGGCAGTGA

Protein sequence

MSKRKQGWLG LLVGLMVLPG MALAADDKPD DAAVLFVSNQ EGAQSIYSAS LNDGAIVRLT 
DPAHSDMDPR WSPDRQRIAF VSRRDGNGDI YLMDADGSNQ QRLTHSERMD FMPQWHPSGD 
YLAFTSSRVS PRGVFLLDLA TGEARLLSEA VRSPEALRWS PDGGQLAVIA RPGGEGGNAI 
MVIDLEDDGH SILVPNDRHA GNVQSLAWHP SGDYLAYTAS TDNRREVQLY VLHVQEGHSE 
QVASAPGNVR GFPVWSTDGD WLVYASTATP APEETKTNIY ASRFPDDGRP VTVATLDGQL 
AQPVWLPNDG GEVVFVSQKG GAAELFRGRV DGAEPSLVFA QPAYMHSPRT GQ