Gene Clim_0159 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_0159
Symbol
ID	6356129
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	177706
End bp	178806
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	53%
IMG OID	642667786
Product	1-alkyl-2-acetylglycerophosphocholine esterase
Protein accession	YP_001942237
Protein GI	189345708
COG category	[E] Amino acid transport and metabolism [J] Translation, ribosomal structure and biogenesis
COG ID	[COG0252] L-asparaginase/archaeal Glu-tRNAGln amidotransferase subunit D
TIGRFAM ID	[TIGR00519] L-asparaginases, type I

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGGAA ACATGAAGAT AGCGGTACTC TATACCGGCG GAACCATCGG GTGTGAGGGT 
ATCCCGCTTG CTCCGGTGAG CGGTGAGCTT TTCAGAAAGA GAGTTTACGC TCTGCCCTGT 
TTCAGGAACG GCAGCATCCG TTGTTCGGAG GGTGATATTG TGTTCAGCAT CGAATGGACG 
GCAAATCCTG TGGACAGCTC GGATCTTATG CCGCTTGATT GGGTGGCAAT GGCTTCATGG 
GTGCTTGAGC ATTATGCGTG TTATGATGGT TTTGTGATTC TGCATGGAAC CGATACCATG 
TCGTGGAGTG CTTCGGCCCT CTCTTTTCTG CTTCAAGGGC TTTCCAAACC GGTTGTATTC 
ACCGGATCGC AACTGCCGCT TGCATCCGGG CGAACCGATG CCGTGCAGAA TCTCCTTACA 
GCGATCATGT TTGCGGCGAA TTTTCGAATT CCCGAAGTAA CTCTTTTTTT CGATCATCTT 
CTTCTGAGAG GAAACCGTTC TGTCAAGGTG GATTCCCGTT CGTTCAATGC CTTTCTTTCG 
CCGAACTATC CGGTACTCGG CAGTGCCGGA ACGGATATGA CCGTGAACCA CAGGGTTCTG 
CTTGATCCTC CGGGGGGTTC TGTTTCATTG GACGAGCAAC GAAACCACGC TCTGCGGAGC 
CGAGAGATTA CGGAGCTGAG TCGGGTACTG CCGGAGTATT CTGTGATTGC CCTGACGCTT 
TTTCCGGGTA TTCAGGCCGG CATGGTGGAT GCTCTGCTTA CTCTTTCGCC TTCGTTGAAA 
GGTATCGTGC TGAAATCGTT CGGTTCGGGC AATGCACCGG CTTCAAGCGG GTTTATCGAC 
GCACTTGCAA GGGCTGCCGA TAAGGGTGTT GTGATTGTCG ATGCGACCCA GGTACTCTCA 
GGCCGGGTAG AAATGAAGCG GTATGAAACC GGTTATCAAC TGCAACGAAA GGTGCATGCG 
GTATGCGGAC ATGATCTTAC GGCTGAAGCG ACGCTTGCAA AGCTGATCTG TCTGACAGGG 
AGAGCCATGA TCGATGGACA TGGCCGTGAA TCGGTTGAAC AGGGAATCGA AACCGTGCTC 
TGCGGAGAGA TGACCCTGTA G

Protein sequence

MSGNMKIAVL YTGGTIGCEG IPLAPVSGEL FRKRVYALPC FRNGSIRCSE GDIVFSIEWT 
ANPVDSSDLM PLDWVAMASW VLEHYACYDG FVILHGTDTM SWSASALSFL LQGLSKPVVF 
TGSQLPLASG RTDAVQNLLT AIMFAANFRI PEVTLFFDHL LLRGNRSVKV DSRSFNAFLS 
PNYPVLGSAG TDMTVNHRVL LDPPGGSVSL DEQRNHALRS REITELSRVL PEYSVIALTL 
FPGIQAGMVD ALLTLSPSLK GIVLKSFGSG NAPASSGFID ALARAADKGV VIVDATQVLS 
GRVEMKRYET GYQLQRKVHA VCGHDLTAEA TLAKLICLTG RAMIDGHGRE SVEQGIETVL 
CGEMTL