Gene Mlg_1821 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1821
Symbol
ID	4268176
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	2080443
End bp	2081579
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	67%
IMG OID	638126577
Product	threonine synthase
Protein accession	YP_742655
Protein GI	114320972
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0498] Threonine synthase
TIGRFAM ID	[TIGR00260] threonine synthase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.540438
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	47
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGTTCC GTCCGCGTTA TACCGGTCTC ATCGCGAAGT ACCACGACCG CCTGCCGGTC 
AAGGATGACA GCCGCCTGAT CAGTCTGGGC GAGGGCAACA CCCCGCTCAT CCGGCTCAAC 
AACATCCCCG GCGAGCTGGG CAAGGACGTG GACATCTACG TCAAATACGA GGGGCTGAAC 
CCCACCGGCT CGTTCAAGGA CCGCGGCATG ACCATGGCGG TGACCAAGGC GGTGGAGGAG 
GGCAGCAAGG CCATTATCTG CGCCTCCACC GGCAACACCT CGGCCTCGGC CGCCGCCTAC 
GCCGCCCGTG CCGGCATCAA GGCCTTCGTG CTCATCCCCG ACGGCAAGAT CGCCATGGGC 
AAGCTCGCCC AGGCGATCAT GCACGGCGCC GATGTGCTGC AGATCCGTGG CAACTTCGAC 
GATGGCATGC GTCTGGTCAA GGAGGTGGCG GAGCAGGCCC CGGTGACCAT CGTCAACTCG 
GTGAACCCCT ACCGGCTCCA GGGCCAGAAG ACCGCCGCCT TCGAGATCGT CGAGGAGCTG 
GAGCGCGCCC CTGACTATCA CTGCCTGCCC GTGGGCAATG CCGGCAATAT CACCGCCCAC 
TGGATCGGCT ACTGCGAGTA CTCCGGGCGC GGCGAGGGCA TCCTCACCGA GGCCTGCACC 
CTGTGCAACG GCCACTGCCG CTACGCCAGT GCTATTGTCG ACAAGCGCCC GGTGATGGTG 
GGCTACCAGG CCAGCGGCAG CGCGCCCTTC CTGCGCGGCC ACATGGTCGA CGACCCGGAG 
ACGGTGGCCA CCGCCATCCG CATCGGCCAT CCCCAGTCCT GGGACTACGC CTGGAAGGTC 
AAGGAGGAGT CCGGTGGCTG GTTCGACGAG TGCACGGACC AGGAGATCCT CGAGGCCCAG 
CGACTGTTGG CCGATCGCGA GGGCGTCTTC TGCGAGCCGG CCTCGGCCAC GTCTCTGGCC 
GGTGCCCTGC GCGATATCCG CCACGGCACC ATCCCCGAGG GCAGCACAGT GGTCTGCACC 
CTGACCGGCC ACGGGTTGAA GGACCCGGAT ATCGCCATCC GCCAGTCCAG TGACGCCCTG 
CGCACCATCG ACGCCACCCT GGACGACGTG CGCCGGGCGA TCACGGATCG CCTGTAG

Protein sequence

MPFRPRYTGL IAKYHDRLPV KDDSRLISLG EGNTPLIRLN NIPGELGKDV DIYVKYEGLN 
PTGSFKDRGM TMAVTKAVEE GSKAIICAST GNTSASAAAY AARAGIKAFV LIPDGKIAMG 
KLAQAIMHGA DVLQIRGNFD DGMRLVKEVA EQAPVTIVNS VNPYRLQGQK TAAFEIVEEL 
ERAPDYHCLP VGNAGNITAH WIGYCEYSGR GEGILTEACT LCNGHCRYAS AIVDKRPVMV 
GYQASGSAPF LRGHMVDDPE TVATAIRIGH PQSWDYAWKV KEESGGWFDE CTDQEILEAQ 
RLLADREGVF CEPASATSLA GALRDIRHGT IPEGSTVVCT LTGHGLKDPD IAIRQSSDAL 
RTIDATLDDV RRAITDRL