Gene Mlg_1168 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1168
Symbol
ID	4269107
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	1365149
End bp	1366246
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	71%
IMG OID	638125917
Product	ribulose-1,5-bisphosphate carboxylase/oxygenase large subunit
Protein accession	YP_742007
Protein GI	114320324
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1850] Ribulose 1,5-bisphosphate carboxylase, large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.275807
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGACG TCCTCACTGC CACCTATGAG CTTTACCTGG CCGAGGGTGA ATCCCCCGAG 
GGCAAGGCCC GCGGCATCGC CCTGGAGCAG ACCGTGGAGA TGCCGGCCGA CTGCCTGCCC 
GGCGACATCG CCGAGCGCAT GGTGGGACGA ATCCGCACGC TCGAGCCGCG GGCGGACCAC 
TGGGTCCTCG AGATCGACTA CCCGCTGGCC GCCATCGGTG GTGAGCTGAC CCAGTGCCTC 
AACCTGCTCT TCGGCAATAT CTCGCTGCAG TCCGGCATCC GGCTGGTTCA GGTGGCCTGG 
CCACCCAGCC TGCTGCGCCG CTGGGGCGGC CCCGGGCTGG GGGTGTCCGG GCTGCGGGCG 
CGGCTGGACG TGGGGGCGCG GCCATTGCTT TGCGCCGCGC TCAAGCCCAT GGGGCTGTCG 
GCACCGGCGC TGGCCGCACG GTGTGCCGCC TTCGCCCGCG GCGGCGTTGA TCTGATCAAG 
GACGACCACG GCCTGGCCGA TCAGCCGGAC GCCCCCTTCG CCGAGCGCCT GAACGCCTGC 
CAGGATGCGG TGCGACAGGC CAACCGCAGG AGCGGCGGCC GCAGCCTGTA CCTGCCCAAT 
GTCACCGCAG CGCCCCAGGC CCTCGGGGAA CGGCTGGCGG CCGCGCGGGA CGCCGGCTGT 
GAGATGGTCC TGATCAGCCC CTGGCTCACC GGCCTCGAGA CCCTGCGCTG GGCGCGGGAC 
GAATACGGCC TGGCCCTGAT GGCGCATCCG GCGATGACCG GCGGGCTGTT TCTGCCGCGC 
CACGGCATCA GCCCGGCCCT GCTGCTGGGC GAGTTATTCC GCATTGCCGG CGCCGATGCC 
GTGATCTATC CCAACGTTGG CGGCCGCTTT CGCTTTTCCG CCGACACCTG CCAGGCCATC 
AACCACGCCC TGCGCCGGCC CCTGGAGGGA CTGGCGAGCG CCTGGCCGAC ACCGGGCGGC 
GGCGTGGACG TGAAGCGGGC TGGCCACTGG AAGCAGGCCT ACGGGCCCGA TACCATCCTG 
TTGATCGGGG GCAGCCTTTA CGCCCAGGGC GACATCGAGG CCGCCTCCCG AGCCCTGATG 
CAAGCGATCC GAGACTGA

Protein sequence

MTDVLTATYE LYLAEGESPE GKARGIALEQ TVEMPADCLP GDIAERMVGR IRTLEPRADH 
WVLEIDYPLA AIGGELTQCL NLLFGNISLQ SGIRLVQVAW PPSLLRRWGG PGLGVSGLRA 
RLDVGARPLL CAALKPMGLS APALAARCAA FARGGVDLIK DDHGLADQPD APFAERLNAC 
QDAVRQANRR SGGRSLYLPN VTAAPQALGE RLAAARDAGC EMVLISPWLT GLETLRWARD 
EYGLALMAHP AMTGGLFLPR HGISPALLLG ELFRIAGADA VIYPNVGGRF RFSADTCQAI 
NHALRRPLEG LASAWPTPGG GVDVKRAGHW KQAYGPDTIL LIGGSLYAQG DIEAASRALM 
QAIRD