Gene Clim_1674 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_1674
Symbol
ID	6353981
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	1840421
End bp	1841911
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	49%
IMG OID	642669279
Product	anthranilate synthase component I
Protein accession	YP_001943695
Protein GI	189347166
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID	[TIGR00564] anthranilate synthase component I, non-proteobacterial lineages

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.00452514
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTATAC CGTTGAGGAG CCCTTCGTTT CTTCTGAAGC CGCTCGTAAG AGAGGTTCAT 
GCCGATACGG AGACCCCTGT GTCAGTCTAT CTCAAACTGC AGCGCCCCTA TTCCTGTCTT 
CTTGAATCCG TTGAGGGCGA AGAGCATCTT GCACGGTTTT CCTATATCGC CATTGATCCC 
GTAGCTGTTC TGAAAGGTAC CGTCGGAGGA GCGGTATCCC TTGAGGTTTT CAATGAACAG 
TTCGGTTCAC TCAGGAAGAT TGTCAATGAA GAGAAAGATT TAAGGAAGAT TATCGATTTA 
TCTCTGCAGC AGTTTGACAC CGATGAAATT CAGGGCAGAA AAAACGGAAC GGACCAGATG 
ATAACCTCAG GTGTGTTCGG TTATTTCAGT TACGATGCCA TGCATCTTGT TGAAAAAATA 
CCTGCTGCGC TTCTGCCCGA TCCGGCAGGC ATGGATGATA TCGTGCTGCT TTTCTGCGAT 
ACGCTTGTTG TGTTCGACAA CATCATGCGA AAGGTCTTTA TTATTGCTAA TTATCTCGAT 
GAGAGCGGTG TTGCCCGGGC TGAAGACAAA ATTGATGCTA TCGCCGGTCA TATGCTGCGT 
CCGCTTGGCT CCGAGGAGGT GCTGCTGAAA TCAGAAAAGC CGGAAGAGGT GGTTTCCAAT 
ACCACAAGAG AGGAATATCT GGCAAAGGTG GATCAGGCGA AGGAGTATAT TCTTATGGGG 
GATATTTTTC AGGTGCAGAT ATCCCAGCGC CTGCGCCGTC CCCTTCATAC CCGGCCGTTC 
GATGTATACA GGATGTTGCG GACCATCAAC CCTTCGCCCT ATCTCTACTA TTTCGATCTG 
GGAGAAGCGA AAATCGTTGG TTCTTCTCCC GAACTGCTCG TAAAGGTTCA TCATGACCCG 
AATGGACGGC GGATGGTAGA TACCAGGCCT ATTGCCGGAA CCAGAAAGCG AGGAGCCACC 
TTTGAGGAGG ACGAACTCAT TGCAGCGGAA CTGCTCTCCG ATGAAAAGGA GTGCGCTGAA 
CATCTCATGC TGATCGATCT GAGCCGGAAC GATATCGGAC GCATTGCCAA GGTCGGAACG 
GTCGATACCA ATGAGATGAT GATCATTGAA AAGTACTCGC ACGTCATGCA CATCGTCAGT 
AACGTACGAG GTGAGCTCAG GGACGATCTC GGTACCATGG ATGCTTTCTG GTCATGTTTT 
CCGGCAGGTA CACTGACCGG CGCACCAAAA GTGCGTGCCA TGGAGATTAT CTATGAGCTT 
GAACACGAGA AGCGCGGATT GTATGGTGGT GCGGTTGGTT TTCTTGACTT CAAGGGAAAC 
CTTACGACTG CGATTGCAAT ACGTACGATG GTTGTGGAGA ACGGGACGAT CTATTTTCAG 
GCTGCTGGCG GGATTGTTGC CGACTCAAAA CCGGAAAGTG AATATGAAGA GACGATGAGC 
AAGATGAGAG CCGGTTTGAC TGCTGTTGAG AATATTGAAG CTTTGCCGTA A

Protein sequence

MSIPLRSPSF LLKPLVREVH ADTETPVSVY LKLQRPYSCL LESVEGEEHL ARFSYIAIDP 
VAVLKGTVGG AVSLEVFNEQ FGSLRKIVNE EKDLRKIIDL SLQQFDTDEI QGRKNGTDQM 
ITSGVFGYFS YDAMHLVEKI PAALLPDPAG MDDIVLLFCD TLVVFDNIMR KVFIIANYLD 
ESGVARAEDK IDAIAGHMLR PLGSEEVLLK SEKPEEVVSN TTREEYLAKV DQAKEYILMG 
DIFQVQISQR LRRPLHTRPF DVYRMLRTIN PSPYLYYFDL GEAKIVGSSP ELLVKVHHDP 
NGRRMVDTRP IAGTRKRGAT FEEDELIAAE LLSDEKECAE HLMLIDLSRN DIGRIAKVGT 
VDTNEMMIIE KYSHVMHIVS NVRGELRDDL GTMDAFWSCF PAGTLTGAPK VRAMEIIYEL 
EHEKRGLYGG AVGFLDFKGN LTTAIAIRTM VVENGTIYFQ AAGGIVADSK PESEYEETMS 
KMRAGLTAVE NIEALP