Gene Clim_1451 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_1451
Symbol
ID	6354764
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	-
Start bp	1556775
End bp	1557782
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	55%
IMG OID	642669061
Product	hypothetical protein
Protein accession	YP_001943489
Protein GI	189346960
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0502] Biotin synthase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.000000857119
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATTG ATGATGTACT GAACAAGACA GGATCGGGCG AATTGCTTTC GCGCGACGAG 
ATGGTTTTTC TGCTTGATTT TCCGTCTGAT TCTATCGGGA CCTATATGGT TATGGCTGAA 
GCAAACCGGA TATCGAAGGA GGTATCGCAG GGAAAAGCTG AAGTTCATGC CCAGTTCGCC 
CTCAATCTTG CGCCGTGCAG TTGCGATTGT CTGTTTTGTT CGTTTGCGGA AGTGAACGGG 
GTTTTCACTG CGTCAACGGC GTTGAGTTCC GACCAGGCTG TCGCTTATGC GCGACAGTTC 
GAAAAGGATG GCGCGAACGC TCTTTTTCTG ATGTCGACGG CACACTATCC GTTTGAGCGT 
TTTCTGGAAA TATCAGGGGA GGTGCGCAAA AACCTGAAGC CGGAAACGAC CTTGATTGCC 
AACGTGGGCG ACCAGTCGAT CAAGAGCGCC CTCAAGCTGA AAGATGCCGG GTTCAGCGGC 
GTGTATCATG CGGTTCGGCT GCGCGAAGGA ATCGATACCA CTCTCGATGT CGGCAGGAGG 
AGGCAGAGTA TTGCGAATTT CAGGGAGGCC GGTCTTGAAG TAGGGACATG CGTTGAGCCT 
GTAGGGCCCG AACATACCAA TGAGGAGCTT GCCGATATGA TCGCATTTAC GGCATCGTTC 
AATCCCGCCT ATAGCGGCGC GGCGCGCAGG ATTCCCATAC CGGGCACCAG ATTGGCCGCG 
CTCGGCATTA TCAGCGAGCT GCGGATGGCT CAGATCGTGG CCGTTACCAG ACTGGGTATG 
CCGAGAAGCG TTTTGGGCAA TTGCACCCAT GAACCGTGTA CATTAGGCGC TATCGCCGGA 
GCGAATCTGT TCTGGGCCGA AGTCGGGGCC AACCCCCGTG ACGTTGAGGC GAAGACGGAG 
GAGGGAAGGG GAGAAAGTGT GATCAGCTGC CGTTCTGTTT TTCAGGAAAG CAATTGGGAG 
GTGCTGCGGG GTCCGTCACG GTTTTATAAT CGAGCAAGTA GCCGGTAG

Protein sequence

MKIDDVLNKT GSGELLSRDE MVFLLDFPSD SIGTYMVMAE ANRISKEVSQ GKAEVHAQFA 
LNLAPCSCDC LFCSFAEVNG VFTASTALSS DQAVAYARQF EKDGANALFL MSTAHYPFER 
FLEISGEVRK NLKPETTLIA NVGDQSIKSA LKLKDAGFSG VYHAVRLREG IDTTLDVGRR 
RQSIANFREA GLEVGTCVEP VGPEHTNEEL ADMIAFTASF NPAYSGAARR IPIPGTRLAA 
LGIISELRMA QIVAVTRLGM PRSVLGNCTH EPCTLGAIAG ANLFWAEVGA NPRDVEAKTE 
EGRGESVISC RSVFQESNWE VLRGPSRFYN RASSR