Gene Mlg_1982 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1982
Symbol
ID	4268525
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	2251743
End bp	2252903
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	69%
IMG OID	638126738
Product	carbamoyl-phosphate synthase small subunit
Protein accession	YP_742814
Protein GI	114321131
COG category	[E] Amino acid transport and metabolism [F] Nucleotide transport and metabolism
COG ID	[COG0505] Carbamoylphosphate synthase small subunit
TIGRFAM ID	[TIGR01368] carbamoyl-phosphate synthase, small subunit

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.157941
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.0125598
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCGCGCGC AACCAGGAGG TCTCTTGAGC ACGCCCGCTA TTCTCGTACT GGAGGACGGC 
ACGGTTTTTC GCGGCCGGTC CATCGGGGTG GACGGCCTGG TGACCGGTGA GGTGGTGTTC 
AATACCGCCA TGACCGGCTA TCAGGAGATC GCCACCGATC CTTCCTACAC GCGGCAGATC 
GTCACCCTGA CCTACCCCCA TATCGGTAAC ACCGGCACCA ATGAGGTGGA TCCGGAGAGC 
AGCGGGGCGC GCCTGGCCGG GCTGGTGGTG CGCGACGTGC CCCCGCGCAT GAGCAACTGG 
CGGGCCACCG GGGACCTCTC CGGCTGGCTC AGCGAGCAGG GCGTAGTGGG CATCGCCGGC 
ATCGACACCC GGAAGCTCAC CCGTCTGCTG CGCGAGCAGG GCAGCAAGAA CGCCTGCCTG 
ATGGCGGGCG AGGTGGACGA GGACAAGGCG CTGGCCGCCG CCCGCGAGTT CCCCGGCCTG 
AAGGGCATGG ATCTGGCCAC CGATGCCGGC ACCGAGGTGC CCTACGAATG GCGTCGCGGC 
AGCTGGGCCC TGGGTATGGG GGTCAGCGAT GCGGGCGACC AGCCGGCGGA CCGCTTCCAC 
GTCGTGGCCT GGGACTACGG GATCAAGCAC AACATCCTGC GCATGCTGGC GGATCGCGGC 
TGCCGGGTGA CCGTGGTGCC ACCGCGCACC AGCGCCGACG AGGTGCTGGG TATGAACCCG 
GACGGGGTCT TTCTCTCCAA CGGGCCCGGC GATCCCGAGC CGTTGGGGTA TGCCATTGAG 
GCGATCCGCC AGGTGGTGGA GGCCGGTCGA CCCACCTTCG GCATCTGCCT GGGCCACCAG 
TTGCTCGGCC TGGCCAGCGG TGCCCGCACC GTGAAGATGA AGTTCGGTCA CCACGGGGCC 
AACCACCCGG TACAGGACCT GGATACCGGC CGGGTGATGA TCTCCAGTCA GAACCACGGC 
TTCGCGGTGG ACGAGGACAG CCTGCCGGAC AACCTCCGGG CCACCCACCG GTCGCTGTTC 
GACGGTTCGT TGCAGGGCGT GGCCCGGACC GACCGGCCGG CCTTCAGCTT CCAGGGACAC 
CCGGAGGCGG GCCCCGGGCC GCGGGACGTG CAACCGCTGT TCGACCGGTT CATTGACCTG 
ATGGCGGCCG AGGGCCGCTG A

Protein sequence

MRAQPGGLLS TPAILVLEDG TVFRGRSIGV DGLVTGEVVF NTAMTGYQEI ATDPSYTRQI 
VTLTYPHIGN TGTNEVDPES SGARLAGLVV RDVPPRMSNW RATGDLSGWL SEQGVVGIAG 
IDTRKLTRLL REQGSKNACL MAGEVDEDKA LAAAREFPGL KGMDLATDAG TEVPYEWRRG 
SWALGMGVSD AGDQPADRFH VVAWDYGIKH NILRMLADRG CRVTVVPPRT SADEVLGMNP 
DGVFLSNGPG DPEPLGYAIE AIRQVVEAGR PTFGICLGHQ LLGLASGART VKMKFGHHGA 
NHPVQDLDTG RVMISSQNHG FAVDEDSLPD NLRATHRSLF DGSLQGVART DRPAFSFQGH 
PEAGPGPRDV QPLFDRFIDL MAAEGR