Gene Mlg_1665 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1665
Symbol
ID	4268897
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	1904869
End bp	1905867
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	69%
IMG OID	638126423
Product	hypothetical protein
Protein accession	YP_742501
Protein GI	114320818
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0547] Anthranilate phosphoribosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAAGT CCCTGCCACC GGAACACCCC TTTGCCACCG TCATCCGCAC CCTGGGCAAG 
GGTCCCCAGA GCAGCCGCTC GCTCAGCCAG GAGGAGGCCG AGGCGGCCAT GGGGGCGATC 
CTGGACGACG CCGTCCAGCC CATGCAACTG GGCGCCTTTC TCATGCTGTT GCGGGTCAAG 
GGGGAGACGG GTGAGGAGAT GGCGGGCTTT GCCCGCGCCG CCCGGGCACG GCTGCAACGC 
CCTCATCAAC CGCTGGCGGT GGACCTGGAC TGGCCCAGCT ATGCCGGCAA AAAGCGCCGC 
CTGCCCTGGT ACCTGCTGGC GGCGAAGCTC CTGTCGCAGC AGGGCTACCG GATCCTGATG 
CACGGCTCCT CGGTCCATAC CCCGGGACGG CTCTATGCCG AGACCGTGCT CGACCTGCTG 
GACCTGCCCC GCTGCAACAG TTGGGAGGAG GCCGGACGGG CCCTCGATCA GCACCACTTC 
GCCTACCTCC CGCTCGAAGT GCTCTCCCCC CGTATGGAGG CGTTGATCAA CCTGCGCCCG 
GTGCTGGGCC TGCGCTCGCC CATCCATACC CTGGCCCGCC TGCTCAACCC GGCGAACGCC 
CCGGCCAGCC TGCACGGCAT CTTCCACCCC GGCTATCTGC AGGTGCACCT GGCGGCTGCC 
GAGACCCTGG GCGAGCAGAT GCTGGTGGTC AAGGGTGACG GCGGGGAGGC GGAGTTCATG 
CCGGACACCG TCTGCAAACT CCGCACGTCG GGGCTCCCCC TCCCCTCGGA GATCACCCTG 
GGGCCGTGGA TGGAGCGCCA GGGCCGCAAG GGACTGGTGA TGCCGGAAGC CGAGCAACTG 
ATGCGCGTTT GGGAGGGGGA CCTGGAGGAC CGCTACGCCG AGTCGGCAGT GATCGGGACC 
ACGGGTCTCG CTCTGCTGGC CATGAACCAA CACGACAAAC CCCAGGCCGC CTTCGACGAG 
GCGGCACGGC TCTGGGCCCG CCGGCCGGTG CCGGCCTGA

Protein sequence

MTKSLPPEHP FATVIRTLGK GPQSSRSLSQ EEAEAAMGAI LDDAVQPMQL GAFLMLLRVK 
GETGEEMAGF ARAARARLQR PHQPLAVDLD WPSYAGKKRR LPWYLLAAKL LSQQGYRILM 
HGSSVHTPGR LYAETVLDLL DLPRCNSWEE AGRALDQHHF AYLPLEVLSP RMEALINLRP 
VLGLRSPIHT LARLLNPANA PASLHGIFHP GYLQVHLAAA ETLGEQMLVV KGDGGEAEFM 
PDTVCKLRTS GLPLPSEITL GPWMERQGRK GLVMPEAEQL MRVWEGDLED RYAESAVIGT 
TGLALLAMNQ HDKPQAAFDE AARLWARRPV PA