Gene Cpha266_1074 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpha266_1074
Symbol
ID	4569751
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides DSM 266
Kingdom	Bacteria
Replicon accession	NC_008639
Strand	+
Start bp	1215460
End bp	1216677
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	50%
IMG OID	639765671
Product	hypothetical protein
Protein accession	YP_911539
Protein GI	119356895
COG category	[S] Function unknown
COG ID	[COG3876] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.408971
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTTCTCT TCAGACTGGT TTCATGGTTG ATGATGGTGC TGCTTTTTTT CTGCGCTACG 
GCTTTTGGCA GAACGTTACG CACCGGGCTC GATGTTCTCG ATGCTTCCGC ATGCCGGGAA 
CTTGAGGGAA AACGGGTAGG GTTGATTACC AATGCCGGAG GGATAAGCGC AAAAGGGGAG 
AGTAATTATC GATTGATGCT TCGTCATGGG GTGAATCTGA AATACCTTAT GGCTCCGGAG 
CATGGTTTTT CAGCCAGAGC GGATGCCGGC AGGAGGCTGG GGGGAACGGT TGTTGATGAT 
ACCCTGAAGG TTTATTCACT CTACGGAGCA TCAAAAAAGC CTGATATCGG GCAACTTAAA 
TCGGTCGATG TGCTGGTTTT CGATCTTCAG GATATCGGCG CCCGATGTTA CACCTATATT 
TCAACCATGA AAAATGCCAT GGAGGCCTGT TCGGAGGCGG GAGTGGCGTT CATGGTTCTC 
GACAGGCCAA ATCCGATTAT GCCTCTTTCT CCATCCGGAT TCATGGTTGA CAAGGGGTAT 
GAGTCGTTTG TCGGGGCGGT AGATGTGCCG TTTATTCATG CCATGACGGT TGGCGAGATA 
GCTCTTTTTC TGAAAAACAC CAGATTCAGG ACGCTTGATC TCAAGATTAT TCCCATGCAG 
GGATATCGCA GAGGGACTCT TGTCGATGAA TATGAGGGAT TTCGGTTTGT CAGTCCATCG 
CCGAACATAA ACAGTACGGT TGCGGCGCTT GTCTATCCTG CGACTGTTTT TCTTGAGGCT 
ACAAAAGTCA GTGAGGGCAG GGGAACCGAT GCCCCTTTCC TTCAGTTCGG CGCTCCGTTT 
ATCGATTCGG CAAGACTTTT GCAGGAGGTT CAGGCTTACC GGTTGCCGGG AGTCGGGTTT 
TCTTCTGTTC AATTTATCCC GAAGTCCGGA AAATTCAGGA ATGAGCAGTG TTTCGGTTTG 
AAGCTGAGGG TTTCAGACAG GAAGCTGTTT TCCCCGTTTA CCACTTCCGC AGTCCTCCTC 
CTTGCACTGC AAAAGCTCTA TCCATCGAGT CTTGGGTTGA AGGAGGGTAG CGTTTTTTTT 
GATCGTCTTG CCGGGACTCC GCTCTATCGG GAGATGATTC TTAAACAGGT GCCTCTTGAC 
GCTATTATAT CGGCAAGCCG CAACGATGTG CAGGAGTTCG AACGACTCTA TCCATCACGT 
TTTATCTATC CTGAATAG

Protein sequence

MVLFRLVSWL MMVLLFFCAT AFGRTLRTGL DVLDASACRE LEGKRVGLIT NAGGISAKGE 
SNYRLMLRHG VNLKYLMAPE HGFSARADAG RRLGGTVVDD TLKVYSLYGA SKKPDIGQLK 
SVDVLVFDLQ DIGARCYTYI STMKNAMEAC SEAGVAFMVL DRPNPIMPLS PSGFMVDKGY 
ESFVGAVDVP FIHAMTVGEI ALFLKNTRFR TLDLKIIPMQ GYRRGTLVDE YEGFRFVSPS 
PNINSTVAAL VYPATVFLEA TKVSEGRGTD APFLQFGAPF IDSARLLQEV QAYRLPGVGF 
SSVQFIPKSG KFRNEQCFGL KLRVSDRKLF SPFTTSAVLL LALQKLYPSS LGLKEGSVFF 
DRLAGTPLYR EMILKQVPLD AIISASRNDV QEFERLYPSR FIYPE