Gene Cpha266_1048 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpha266_1048
Symbol
ID	4571010
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides DSM 266
Kingdom	Bacteria
Replicon accession	NC_008639
Strand	+
Start bp	1187162
End bp	1188424
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	50%
IMG OID	639765651
Product	pentapeptide repeat-containing protein
Protein accession	YP_911519
Protein GI	119356875
COG category	[S] Function unknown
COG ID	[COG1357] Uncharacterized low-complexity proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0897049
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCTCTA AAACGATACG TTTTTTTTTA CCCATCCTTC TCAATGCGGC TTTGATCCCG 
GTTTTTTCTT GTCGCGTATC AGCATTTAAC CCATCACATC TTGATTCGCT CAATGCCGGA 
GTGAAATCGT GGAACAACAT GAGAACCCTG CATAAAGATT TTACCCCTGA TCTTTCAGGT 
GCAATACTCA AGGGTCGCAA TCTCAGAGGA GCCGATTTCC AAAACGCCAA TTTTTCAGGT 
GCCGTGCTGA CCGATTCCGA TCTCAGCAAT GCGAACTTGC GGAATGCTTC GCTTGACGGG 
GCAAGGATGA GTGGAGCGCT ACTGATTCGG GCGGATTTTC AGGGTGCCCG CATGCATGCC 
GTCGATCTTG AGGGCGCAGT GCTTGATGGC GCTCATCTTC AAAAAGCAGA GCTTCAACAA 
TCGATTCTGC GAAAAGCCGA TTGTTCCAAT GTTGATTTTT CAGATGCGGA TCTTCGCGAC 
TGCAATTTTC GGGAGGCGTC GCTGGCCAAC GCAACTCTAA TCGGTGCGGA TTTACAGGCG 
GCATATCTCT GGAGGGCCAA TTTCAGCAGG GTAAAGCTCC GTGGCGTCAG GGTATCAGAT 
GCAACTATTC TTGATACCGG ACGATATGCC ACCGAGGAGT GGGCCAGAGA TCGTCAGGCA 
GTTTTTCTAT CGGCATCCCC ATCTGTTGAT CCATTGAAAG CTTCTTCTGA CGCATCTTCT 
GCAGCAGTAG AGGGTGGTTC GAAAAATGCG CGTTCACAAG GGCGCTCTTC TCCAGCTCAT 
CTTGTCCGGA ATGCTGCTTC AACGGCAAAT ATCTGGAGAA AAGCCGAGAT TCAATCGGCG 
GTTTTGTATG ACAGAAAGCA GTACGAGCAA CTTAAGCGCA ATGTTTTCGA CTGGAATAAA 
ACGAGAAAAC AGAACAGCGC CATGCGTGTT ACGCTTCATG GTGCTGATTT TGATCATAAA 
AATCTCAGTT ATGCTGATTT AGCAGGGGCC GATCTTGCAG CCTCCACGTT CAAGGGTGCT 
GATCTTGAAG AGAGCGATCT GAGAAAGGCT GATCTCAGTG GGTGCGATTT TCGGGAAGCG 
AGTTTGCGTG GAGCCGACCT TGGTGGAGCT GATCTGAGGG GCGCCAATTT CTGGCGGGCA 
AATCTCGACC GTATTCGTCT TGATGGTGCT GTTGTTTCCG CTGCAACTGT GCTTGATTCA 
GGTAAACATG CTACGTCTGA ATGGGCTGTT CGCTTTGGCG TTACATTTGC AGAAGAGAAG 
TGA

Protein sequence

MRSKTIRFFL PILLNAALIP VFSCRVSAFN PSHLDSLNAG VKSWNNMRTL HKDFTPDLSG 
AILKGRNLRG ADFQNANFSG AVLTDSDLSN ANLRNASLDG ARMSGALLIR ADFQGARMHA 
VDLEGAVLDG AHLQKAELQQ SILRKADCSN VDFSDADLRD CNFREASLAN ATLIGADLQA 
AYLWRANFSR VKLRGVRVSD ATILDTGRYA TEEWARDRQA VFLSASPSVD PLKASSDASS 
AAVEGGSKNA RSQGRSSPAH LVRNAASTAN IWRKAEIQSA VLYDRKQYEQ LKRNVFDWNK 
TRKQNSAMRV TLHGADFDHK NLSYADLAGA DLAASTFKGA DLEESDLRKA DLSGCDFREA 
SLRGADLGGA DLRGANFWRA NLDRIRLDGA VVSAATVLDS GKHATSEWAV RFGVTFAEEK