Gene Clim_0478 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_0478
Symbol
ID	6354473
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	541170
End bp	542201
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	51%
IMG OID	642668109
Product	Tetratricopeptide TPR_2 repeat protein
Protein accession	YP_001942550
Protein GI	189346021
COG category	[R] General function prediction only
COG ID	[COG4785] Lipoprotein NlpI, contains TPR repeats
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAACTC GCATTCTCCC TTTTTTTCTC TTTTTTTTTG TATTTGTTCT CCCCGTTGTT 
TCTGCTGCAG ACGACTTCGA TGCTCTGTTT GTGCAAGCCG GGATGAAATA CCGGAAAGGC 
GATTTTCAGG GCGCATCGGC TCTGTATACT GCCGTGCTGA GCGGCAATCC GCGTTCTGCG 
GAAGCGTATA ACAACCGCGG GCTCTGTAAA GCAGCTTCAG GAGATGTCAC CGGCGCTGTT 
GCTGACTATT CCGAAGCCCT TAAACTCGAT CCGTCCCTGG CGGCGGCCTC CAATAACAGG 
GGCCTCGCAA TGGCAAAGAT CGGGAAGTAT CATGAAGCTG TTCTCGATTA TAATCAGGCC 
CTCCGTATCA ATGCCGTTCT GCCTGAAGTG TACAACAATC TCGGATTGGC CAGAATCGCA 
TTGGGAGATC AATCAGGAGC ACTCGACGAT TTCAATACGG CCCTTGCGCT TAAACCTTTT 
TATCCCGAAG CGCTTTTTAA CAGGGGGTGT GCCCGGCAGA AGCTGTCAGA ACACCGGGAA 
GCTCTTCGGG ACTTTCAACA GGTCATATCC TTCAGATCGG GATATGCCGA GCCTTATTTT 
TATGCTGCGC TTTCACGTTC TGCTATGGGG GATCACAAGG GCGCTCTCGT AGATTATACA 
AAAGCGATTG CCATTTCTCC CTCATACGCG GAAGCTTTTG CAGGCAGAGC GCTTGCGAAG 
ATCAGAAGCG GTGATTATCG CGGGGCTCTC GACGATTACG ATACGGTGAT AGGGCTGCAG 
TCTGATAATC CGGAACTTTA CTATAATCGG GCGCTGGTCA AGGTCAAGCT GTCTGACTAT 
CCGGGAGCTG AAATTGACTG TTCACTCGCT CTCGAACGGA ACAAGGTATA TGCCGAAGCT 
TTTTTTCTCA GGGGTATCGT TCGGAGTGAA CTTGGAAACC GCGAGGGTAT GCTTGCCGAT 
TTGCGTTTTT CTGCAGATGC AGGTTATGAG CCGGCAAAGA AGCTGCTGAA AAAAGAACGG 
GACAGGAGAT AG

Protein sequence

MKTRILPFFL FFFVFVLPVV SAADDFDALF VQAGMKYRKG DFQGASALYT AVLSGNPRSA 
EAYNNRGLCK AASGDVTGAV ADYSEALKLD PSLAAASNNR GLAMAKIGKY HEAVLDYNQA 
LRINAVLPEV YNNLGLARIA LGDQSGALDD FNTALALKPF YPEALFNRGC ARQKLSEHRE 
ALRDFQQVIS FRSGYAEPYF YAALSRSAMG DHKGALVDYT KAIAISPSYA EAFAGRALAK 
IRSGDYRGAL DDYDTVIGLQ SDNPELYYNR ALVKVKLSDY PGAEIDCSLA LERNKVYAEA 
FFLRGIVRSE LGNREGMLAD LRFSADAGYE PAKKLLKKER DRR