Gene Mlg_2325 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2325
Symbol
ID	4270580
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	2635515
End bp	2636714
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	65%
IMG OID	638127083
Product	putative polysaccharide biosynthesis protein
Protein accession	YP_743155
Protein GI	114321472
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3980] Spore coat polysaccharide biosynthesis protein, predicted glycosyltransferase
TIGRFAM ID	[TIGR03590] pseudaminic acid biosynthesis-associated protein PseG

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	0.412888
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGTGG CAGCGCAACA CAGGACAACG ACTGGCGGGA TGCGCGTCGC CTTCCGCGTG 
GACGCCTCCC TGGCGATCGG ATCGGGTCAC GTCATGCGCT GCCTCACCCT CGCCGGGGCA 
CTGTGCGAGC AGGGCGCGGA CTGCCATTTC CTCTGCCGCG AGCCGCAAGG TCATCTCAAC 
AGTCAGATAG CCGAGCGGGG ATTTGCGGTT CATCGTCTGC CCGCGGTAGA GGATGGCTCG 
ATAACGTCGC CCGCCGGTTC GGGCCGTTCA GCGAGCGTGG ATGACGAACC ACCGCAACCG 
AAACACGCCG AGTGGCTGCA AACCACCCAG GCGACCGATG CCCGCCAGAG TCTCGAAACG 
CTGCGAGAGC TGGCACCGGA CTGGCTGATC GTCGACCACT ACGCACTGGA TGCCCAGTGG 
GAGGCGCGGG TTCGAGAGGC CATTCCGGGG ATGCGCGTCA TGGTCATCGA CGATCTGGCC 
GACCGCCTGC ACCAGGCCGA CCTGCTGCTG GACCAGAACC TGGGCCGCAA GGCCGAGGAC 
TACCGTGACC TCGTCCCGGC CCACTGCCGC CTTCTCGTCG GGCCGAAGTA CGCCCTGTTG 
CGCCCGGAAT TCGCCGAATG GCGGGAATGG AGCCTGGAAC GCCGACAGGA GAACGGGCCG 
GTCAGGCGGC TGCTGGTCAG CCTCGGCGGC GTGGACAGGG ACAACGTCAC CGGGCAGGTC 
CTCGATGCCT TGTCCGAAGT CGAGTTGTCG AAAGAAATGG AAATCACCGT GGTCATGGGC 
GCATCCGCCC CTTGGCTTGA AGCGGTTCGG GGCCGCGCCC GGCAGATGCC GTGTTCGACG 
GAAGTCGTGG TTAACGTCGA TGACATGGCC CGGCGCATGG CCGAGGCCAA TCTTGCCATC 
GGCGCGGCGG GCAGCACGGC GTGGGAGCGC TGCTGTCTTG GCTTGCCGAC CATCGTGCTG 
GTGCTGGCGG AGAATCAGCG GGAGATCGCG CGAAGCCTGC ATCGTGCGGG TGTGGCTCAT 
TCACTTGGTG CCCCTGATGC ATTGTTCGAT CTGGTTGGCC AATGGCCAAT GATCACCCAG 
CCAGAGTACT TGAAAGGCCT GAGCCGGAAG GCCGCAAGCC TGGTGGATGG CCGTGGTGCC 
GTCCGTGTGC GGAATGGGCT GATGGGCGTT GAGATGGCGA ACGAGGCGAA CGATGGTTGA

Protein sequence

MAVAAQHRTT TGGMRVAFRV DASLAIGSGH VMRCLTLAGA LCEQGADCHF LCREPQGHLN 
SQIAERGFAV HRLPAVEDGS ITSPAGSGRS ASVDDEPPQP KHAEWLQTTQ ATDARQSLET 
LRELAPDWLI VDHYALDAQW EARVREAIPG MRVMVIDDLA DRLHQADLLL DQNLGRKAED 
YRDLVPAHCR LLVGPKYALL RPEFAEWREW SLERRQENGP VRRLLVSLGG VDRDNVTGQV 
LDALSEVELS KEMEITVVMG ASAPWLEAVR GRARQMPCST EVVVNVDDMA RRMAEANLAI 
GAAGSTAWER CCLGLPTIVL VLAENQREIA RSLHRAGVAH SLGAPDALFD LVGQWPMITQ 
PEYLKGLSRK AASLVDGRGA VRVRNGLMGV EMANEANDG