Gene Clim_1250 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_1250
Symbol
ID	6355351
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	1349175
End bp	1350377
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	54%
IMG OID	642668866
Product	argininosuccinate synthase
Protein accession	YP_001943296
Protein GI	189346767
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0137] Argininosuccinate synthase
TIGRFAM ID	[TIGR00032] argininosuccinate synthase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAAGG AAAAAATCGC ACTTGCCTAT TCCGGAGGCC TCGATACCTC CGTGATGATC 
AAATGGCTCA AAGACAAGTA TGACGCCGAA ATTGTTGCCG TTACCGGTAA CCTCGGCCAG 
CAGAAAGAGA TCGAAAATCT CGAATCAAAA GCATATTCGA CGGGAGCCTC GGCTTTCAGG 
TTTGTCGATC TCCGCAAAAC CTTTGTTGAA GAGTATATCT GGCGGGCACT GAAAGCCGGC 
GCCCTTTACG AGGATGTCTA TCCGCTGGCA ACGGCGCTCG GGCGTCCGCT GCTTGCCAAA 
GCGCTTGTCG ATGTGGCACT TGAGGAGAAC TGCACCATGC TGGCCCACGG CTGTACCGGA 
AAAGGAAACG ACCAGGTTCG TTTCGAAGTG ACCTTTGCTT CGCTTGCTCC CCATCTGAAA 
ATTCTCGCTC CCCTGCGCGA ATGGGAGTTC ACTTCTCGCG AGGCAGAGAT CGCCTACGCT 
CTCGAACATA ACATACCGGT ATCGGCCACA AAGAAAAGCC CCTACTCGAT CGACGAGAAC 
ATCTGGGGCA TCAGTATCGA ATGCGGCGTG CTCGAAGATC CCATGGTGAC TCCTCCCGAA 
GATGCCTACC AGATCACCAC CTCTCCGGAA AATGCGCCCG ATACTCCGGC ATCGGTGGAG 
ATCGAATTTG TGAAAGGCAT ACCGGTAGCT CTCGACGGCG AGCGTATGAG CGGACTCGAC 
ATGATCCAGA AACTCAACGA CATCGGCGCG GCAAATGGCA TCGGACGTCT CGACATGATC 
GAGAACCGCG TTGTCGGCAT CAAGTCGCGT GAAATCTACG AGGCACCGGC AGCAACCATC 
CTGCACTTCG CACACCGTGA GCTGGAGCGG CTGACGCTTG AAAAAACCGT ATTCCAGTAC 
AAGAAGAACA TCAGCCAGGA CTACGCCAAC ATCATCTATA ACGGCACCTG GTTCTCCCCG 
ATGCGCAAGG CACTTGATGC CTTCGTCGAC GAAACCCAGA AACCGGTAAC CGGTCTTGTG 
CGCCTGAAGC TTTACAAAGG CGGTATCTCG CTGCTCGGCA GAAACTCGCC GAACTCGCTC 
TACAACGAAG AACTTGCGAC CTACACCGAA GCCGATACCT TCAACCACAA GGCAGCGGCA 
GGGTTCATTC ACCTGTACGG GCTTGGCATG AAAACCTTCA GCCAGGTCAA TCCCGGTCTG 
TAA

Protein sequence

MSKEKIALAY SGGLDTSVMI KWLKDKYDAE IVAVTGNLGQ QKEIENLESK AYSTGASAFR 
FVDLRKTFVE EYIWRALKAG ALYEDVYPLA TALGRPLLAK ALVDVALEEN CTMLAHGCTG 
KGNDQVRFEV TFASLAPHLK ILAPLREWEF TSREAEIAYA LEHNIPVSAT KKSPYSIDEN 
IWGISIECGV LEDPMVTPPE DAYQITTSPE NAPDTPASVE IEFVKGIPVA LDGERMSGLD 
MIQKLNDIGA ANGIGRLDMI ENRVVGIKSR EIYEAPAATI LHFAHRELER LTLEKTVFQY 
KKNISQDYAN IIYNGTWFSP MRKALDAFVD ETQKPVTGLV RLKLYKGGIS LLGRNSPNSL 
YNEELATYTE ADTFNHKAAA GFIHLYGLGM KTFSQVNPGL