Gene Clim_1251 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_1251
Symbol
ID	6355352
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	1350487
End bp	1351878
Gene Length	1392 bp
Protein Length	463 aa
Translation table	11
GC content	54%
IMG OID	642668867
Product	argininosuccinate lyase
Protein accession	YP_001943297
Protein GI	189346768
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0165] Argininosuccinate lyase
TIGRFAM ID	[TIGR00838] argininosuccinate lyase

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTTTCA TGAGCAACAA GAAAGAACTT CTCTGGCAGA GCCGGTTTTC CGAGCCGTTC 
GACCGTGACG CGCTCCGCTT CTCTTCATCG GTGCATGTCG ATAAAGCTCT TTTCAGGGAG 
GATATAGAGG GCTCGACTGC CCACGTCACC ATGCTGGCAG AAGAGGGAAT AATTTCCGAA 
GAGGAGTCAG GGCAGATTAT TCGCGGCCTG CGGGAAATCG GAGCGGAACT TGAAGCGGGT 
GATCTCGTGC CTCACTGGGA AGACGAGGAT ATTCATACGG TAATCGAAAA TCGCCTGAAA 
GAGAAAATCG GTGCCACTGC AGGAAAAATA CACTCAGGAA GAAGCCGGAA CGACCAGGTT 
GCCACCGATA CCCGACTCTA TCTCCGCCGG CAGATCCGCA CGCTTGGTAC CGCACTGCAG 
GGACTGCAGA AAACCCTCGT TTCGAAGGCT GAAACCTACA GGGAGACGAT CATTTTCGGC 
TACACCCATC TGCAGCGGGC ACAGCCCATA TCGGCCGGTC ATTACTATCT CGCCTATTTC 
AACATGTTCC GGCGCGACCG CGACCGGCTG ACCGATCTTC TCAAGCGGGT CAACATCTCT 
CCGCTCGGTG CGGCGGCGTT TGCCGGAAGC ACCCTTCCGC TCAACCCCGC AAGAAGCGCG 
GAGTTGCTTG ATTTCGACGG AGTGTTCTCC AACAGTATCG ATGCCGTGAG TGACCGTGAC 
ACCGTTATCG AGTTTATTTC CGTCTGTTCG ATGGTGATGA TGCACCTGTC AAGATTTGCC 
GAAGATCTGA TTCTCTGGAG CTCCTACGAG TTCGGCTACC TTGAAATCAG CGACGCCTTT 
GCCACCGGCT CTTCGCTTAT GCCGCAGAAA AAAAACGCAG ATATTGCGGA ACTGGTACGG 
GGAAAAACCG GAAGGGTATA CGGCAGTCTC ATCACCATGC TGACCATCAT GAAAGGGCTT 
CCTCTCTCCT ATAACCGGGA TATGCAGGAG GACAAACCCC CGCTTTTCGA TACGGCCGAA 
ACGACCATCG AGAGCGTCTC GATTTTCGGA AAGCTGCTCG AACACACCAC ACTCAAAGAG 
GAACGGCTTG CAAAGCTGAC GGCCGATGAC CTCAGTCTTG CTACCGAGAT TGCCGAATAT 
CTGGTAAAAA AACAGCTTCC GTTCAGGGAC GCCCACCGGG TTACCGGCAG AATCGTCTCT 
CACAGCCTCA TGTCCGGCAC GACGCTTCCC GGGATCACCC TGGACGTGTA CAGAACGTTT 
TCGGAGCTGT TCGAGAGCGA TATTTACGCC GCCCTTAAAC CCGAAGCGAG CATCAAGGCA 
AAAAAAACGC ACGGCAGCTG TTCCTTCGAC TCCGTAGCAA TACAGCTTGA AGAAGCAAAA 
AAGCTGCTGT AG

Protein sequence

MFFMSNKKEL LWQSRFSEPF DRDALRFSSS VHVDKALFRE DIEGSTAHVT MLAEEGIISE 
EESGQIIRGL REIGAELEAG DLVPHWEDED IHTVIENRLK EKIGATAGKI HSGRSRNDQV 
ATDTRLYLRR QIRTLGTALQ GLQKTLVSKA ETYRETIIFG YTHLQRAQPI SAGHYYLAYF 
NMFRRDRDRL TDLLKRVNIS PLGAAAFAGS TLPLNPARSA ELLDFDGVFS NSIDAVSDRD 
TVIEFISVCS MVMMHLSRFA EDLILWSSYE FGYLEISDAF ATGSSLMPQK KNADIAELVR 
GKTGRVYGSL ITMLTIMKGL PLSYNRDMQE DKPPLFDTAE TTIESVSIFG KLLEHTTLKE 
ERLAKLTADD LSLATEIAEY LVKKQLPFRD AHRVTGRIVS HSLMSGTTLP GITLDVYRTF 
SELFESDIYA ALKPEASIKA KKTHGSCSFD SVAIQLEEAK KLL