Gene Cpha266_1566 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpha266_1566
Symbol
ID	4568940
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides DSM 266
Kingdom	Bacteria
Replicon accession	NC_008639
Strand	-
Start bp	1780578
End bp	1782587
Gene Length	2010 bp
Protein Length	669 aa
Translation table	11
GC content	48%
IMG OID	639766148
Product	TPR repeat-containing protein
Protein accession	YP_912012
Protein GI	119357368
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.00212448
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATACGAT GGAGCCGTTA CCGATGGCTT TCTATTGGTT TTTTGTTCTG CTTTGTTTGG 
TTCAAGAGCG TGTCGGCTGA AACGGGTTCT TCTCTGCCGC CTGATAAGAG TCCTTTGGCT 
TCGGACTCTT CAATCTTTTT GAATACCAGC AAAGGGAGTT TATCCGATTT TTTACAGTCG 
TCTCAAAAAA CAACAGTTCA AAAAGAGTCG CTTAAGAGCA GAGGGTATTA TCTGCAACTT 
ATGGATACGA TGAGGAGTGA TGCAGGGGCG CGGCAGCCGG TTGATAACCC TGATAAGATG 
CTGTTTCATG ATCGTATCAG TGATAGCGTC GGGCAGATGG TTAAAAACCC GCAAACAACG 
AGTCGCACAA AGCAGCAGTC ACTGAGGAAA AAGCAGGTGA AGGACAGTCT TGTGATGGAT 
TCGAGAAAGA AATCGCAAGA ATTACGGCAG CAAAAGGAAC GGCTTCGCAA AAGGGTGCTT 
GACAGCCTTA ACAATACGGT AATGAAGGCC CGGTTGCAGG ACAGCATCAG TCAGGTTGTG 
CGGATACAGC GTTACAAGGA TAGTCTGCGG CAGGCGACTC TGAAGGAGCG AGAGCGAGAC 
AGTCTGAAAA TGGCGGCCTT GATGCAGAAG AGTGACGCCG TTTTGAGGCA GCGTGAGAGG 
CGAAAACAGC TACGGGACAG TCTGAGGGAG GCAGAGAAAA AGAACTCTCA ACACACCCTC 
TTTCGGCAAG GCGGCGCCCA GACAACACGC AATAGCGCAC AGGCACTTCA GCAGGAACGT 
GTACATGAGG TAACGAGCAA AATATCTCGT CAGGAAGTCG TCGCTATCTC TGCGGGAGCA 
GTTCCATCAG TTCAGACGCT CTCGGCAAAG AGCAGCGCAA AGAGAAGGCT TGATAGCCTC 
AGTGCTGTCG CGGCTGATTT TTACGGTCGG GGTCTTTATG CTAATGCGCT GGTTCCGGCA 
AAACAGGCTC TTTTGCTTGC CAGAAAAGTT CATGGCACGA ATTCCGCCGG TGAAGCCGCT 
TCAATGGTGA GGCTTGCCGA TAACTATCGC TCGATGAAAC AGTACAATGC GGCGGAACTG 
CTCTATAATC GGGCTCTTGC TATCACCCAA AACATATCGG GCGTTTGGCA CAGGGATGCC 
GGTTTGCTTC TTTACACCCT TGCCAGACTC TCTTTCGAGC AGCAGCAATA TCAGCTTGCC 
GAGCAGTACT TCAGGCAGGC ATTGTCTGTC AGAGAAAAAG AAGAAGGTGT TGACGGGCCG 
GGCGTTGTCG ATATAGTCTA TGATATGGGC CAGCTCTATC ATCGTCTTCA AAATTATAAT 
GCGGCTCTTC TGTACTACAG CAGATTATTG GCCATTCGGG AAAAGTCTGT CAGGGCAGAC 
GATCTGGAAT TTGCTGCAAT GTTATATTCT ATCGCGGATC TTTATGCTGC TATCGGTCAG 
TTTGACGTTG CTGCTGATTT TTTTCAGCGT TCACTTGATA TCCGTGAAAA ACTGTCCGGG 
CCATCACATC CCGATGTAGC ATTCTCAATG AACGGTCTTG CAATGGTTTA CCAGAAGCAA 
CGACAGTATA CCGTTGCCGA GTTGCTGTAT AAGCGTTCGC TTGCCATTCA GGAGCAGACT 
TTTGGGCCTG CACATCCTGA AGTTGCCGTT ACGTTGCAGA GTCTGGCTTC GGTATGCAGG 
TTTCAGAAGA AATATGATGC GGCAGAGCAC TACATCAAGC GTTCCGTCGA GATCACAGAA 
AAGAACTTTC CCGCAACCCA CCTGAATGTT GCAAAGTCCC TGAATTCGAT GGCTTTGCTT 
TACCTTGAAC TGGGAAACTT CGGAGTTGCC GAGCCGTTAT TTAAAAGAGC ATTGGCAATA 
TCTGAAAAGA AACTTGGTGC ATACCATACA GATCTTGCCC AGGTTCTTGA AAATATGGCG 
TTGATGTATG AAAAAATGGA TCGAAAAAAA CAGGCTGAAT CTTTTGCAAA AAGAGCAGAA 
CGGATTCGTG AACTGGCAGA CAATGATTGA

Protein sequence

MIRWSRYRWL SIGFLFCFVW FKSVSAETGS SLPPDKSPLA SDSSIFLNTS KGSLSDFLQS 
SQKTTVQKES LKSRGYYLQL MDTMRSDAGA RQPVDNPDKM LFHDRISDSV GQMVKNPQTT 
SRTKQQSLRK KQVKDSLVMD SRKKSQELRQ QKERLRKRVL DSLNNTVMKA RLQDSISQVV 
RIQRYKDSLR QATLKERERD SLKMAALMQK SDAVLRQRER RKQLRDSLRE AEKKNSQHTL 
FRQGGAQTTR NSAQALQQER VHEVTSKISR QEVVAISAGA VPSVQTLSAK SSAKRRLDSL 
SAVAADFYGR GLYANALVPA KQALLLARKV HGTNSAGEAA SMVRLADNYR SMKQYNAAEL 
LYNRALAITQ NISGVWHRDA GLLLYTLARL SFEQQQYQLA EQYFRQALSV REKEEGVDGP 
GVVDIVYDMG QLYHRLQNYN AALLYYSRLL AIREKSVRAD DLEFAAMLYS IADLYAAIGQ 
FDVAADFFQR SLDIREKLSG PSHPDVAFSM NGLAMVYQKQ RQYTVAELLY KRSLAIQEQT 
FGPAHPEVAV TLQSLASVCR FQKKYDAAEH YIKRSVEITE KNFPATHLNV AKSLNSMALL 
YLELGNFGVA EPLFKRALAI SEKKLGAYHT DLAQVLENMA LMYEKMDRKK QAESFAKRAE 
RIRELADND