Gene Mlg_1239 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1239
Symbol
ID	4269023
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	1443650
End bp	1444963
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	71%
IMG OID	638125989
Product	FolC bifunctional protein
Protein accession	YP_742078
Protein GI	114320395
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0285] Folylpolyglutamate synthase
TIGRFAM ID	[TIGR01499] folylpolyglutamate synthase/dihydrofolate synthase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.168236
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	0.703163
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCGACA CCCCGGGATC GGCCGCCCCA ATGCCCCAGC GCGACCGTTG GCGGCTGGAG 
GACTGGCTGC GGTGGCAGGA AGGGCTCAGC CCGGTGGAGA TCAACCCCGG GCTGGAGCGG 
GTGCAGGCGG TCGGCGAACG GCTGGGTGCC CTCACGCCCC GTTGCCCGGT CATTACCGTG 
GCCGGTACCA ACGGCAAGGG CTCCTGCATC GCCTACCTGG AGGCAATGCT CGGTGCCGCC 
GGATACCGGA CCGCTGCCTA CACCTCGCCG CATCTGTTGC GCTATAACGA ACGCATCCGG 
CTGGCCGGGG TCCCGGTGAG TGATGAGGCC ATCACGGCGG CCTTCTCCCG CGTGGAACAG 
GCCCGGCAGG GCACCCCGTT GACGTATTTC GAGTACGGCA CGCTGGCCGC TCTGAGCCTG 
TTCAGCGAGG CGGAGGCCGA GGTCTGGCTC CTCGAGGTGG GCATGGGCGG GCGCCTGGAC 
GCGGTGAACG CGGTCGATCC CGATTTGTCC ATAATCACGA GTATTGGCCT CGATCACACC 
GAGTGGCTGG GCGCGGATCG CGAGCGGATT GGCGCGGAGA AGGCCGGTAT CATGCGTCCG 
GGACGGCCCG TCTGCCTGGG CCAGGCGGAC CTCCCCGACA GTGTGTCCGA TCGGGCCCGG 
ACGCTGCGGG CGCCGGTGAC CGCGGCCGGT CGCGACTTCC ATTGGCGGCG ACAAGCCCTG 
GGCTGGGACT GGCTCAGCGG CGACGAGCGA CTGGACGGCC TGCCCTGGCC CGGGCTGACC 
GGGACGGTGC AACTGGATAA CGCGGCGGTG GTCATCGCCG GTCTGAGGCG GCTGCGGGAG 
CGGCTCCCGG TGGATCGCGC CGCGCTCGAG CGGGGACTGC GCAGCGCCCG CCTGCCCGGA 
CACATGGAGC GGGTCCGGCG CCGGGGCGTG GAGTGGTTGT TCGACGTGGC CCACAATGAG 
GACAGCGTGC GCGTATTGGC CGAGACGGTC CGGGACGAGG CGGGCAAGGG GCGCGTCATC 
GGGCTCTTTG CCGCCATGCA CCGCAAGGCC CTGTCCGGTG TGCTTGCCAC CATGGGTGCA 
GTGGTGGACG AGTGGTATCT GCCACGGTTG GAGGATCCCC AGGCGCATCC GCCGGAGGCG 
GTGGCGGCGG GCCTACGCGA GACTGGGGTG GATGCCTCCG TTATCCATAC CGGCGGCCTG 
TCGGCCCTGC TTGCCGCGGT AGCGGACCGC GCCCGCCCCG GGGACCGGGT GGTGGTGTTC 
GGCTCGTTCC GTACCGTCGA GGCGGTGATG CGGGCCGGAG GGCGCGTAGA CTGA

Protein sequence

MPDTPGSAAP MPQRDRWRLE DWLRWQEGLS PVEINPGLER VQAVGERLGA LTPRCPVITV 
AGTNGKGSCI AYLEAMLGAA GYRTAAYTSP HLLRYNERIR LAGVPVSDEA ITAAFSRVEQ 
ARQGTPLTYF EYGTLAALSL FSEAEAEVWL LEVGMGGRLD AVNAVDPDLS IITSIGLDHT 
EWLGADRERI GAEKAGIMRP GRPVCLGQAD LPDSVSDRAR TLRAPVTAAG RDFHWRRQAL 
GWDWLSGDER LDGLPWPGLT GTVQLDNAAV VIAGLRRLRE RLPVDRAALE RGLRSARLPG 
HMERVRRRGV EWLFDVAHNE DSVRVLAETV RDEAGKGRVI GLFAAMHRKA LSGVLATMGA 
VVDEWYLPRL EDPQAHPPEA VAAGLRETGV DASVIHTGGL SALLAAVADR ARPGDRVVVF 
GSFRTVEAVM RAGGRVD