Gene Cpha266_2264 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpha266_2264
Symbol
ID	4568486
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides DSM 266
Kingdom	Bacteria
Replicon accession	NC_008639
Strand	-
Start bp	2594437
End bp	2595744
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	59%
IMG OID	639766826
Product	HipA domain-containing protein
Protein accession	YP_912680
Protein GI	119358036
COG category	[R] General function prediction only
COG ID	[COG3550] Uncharacterized protein related to capsule biosynthesis enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGTACAA CAGCAAGGGT AAACCTGTGG GGGCGCACGA TCGGGGCTGT ATCGCTCGGT 
AGCGACGCTG CGACTGCAAC CTTCGAGTAC GATCCGGCCT TCGTTCAGAG CGGCATCGAA 
ATCGCCCCGT TGACCATGCC GCTCTCCGGT CAGCTCTACT CCTTTCCCTC GCTGCGTCCC 
GAAACCTTCC ATGGGCTTCC GGGACTGTTG GCGGATTCGC TGCCGGATCG GTTCGGCAAT 
GCGCTGATCG ATGCCTGGCT GGCCCGTTCC GGTCGCACAC CCGGTTCCTT CAATGCCGTC 
GAGAGGCTCT GTTATACGGG GTCTCGGGGC ATGGGCGCCC TTGAATATGC TCCAGCCATA 
CGGTTGGGGG TCTCCGGCTC TGCGCCGGTC GAAATCGAAC GGTTGGTCGA GTTGGCTTCG 
GAGGTGTTGA CCCATCGCAA CGATCTGCAG GTCTGGTTCC ACGATGAGGG CAAGGAGCTT 
GCGCTCGGGG AGATTCTCCG GGTCGGCACC TCCGCGGGCG GAGCGAGAGC CAAGGCGGTG 
ATTGCCTGGA ACCCGGAAAC CGACGAAGTT CGTTCAGGCC AGGTGAAGGC CGGAAAAGGG 
TTCGAGTACT GGTTGCTCAA GTTCGACGGG GTGAGTGGCA ACAAGGACAA GGAGCTGGAA 
GATCCAAAAG GGTACGGTGC AATCGAGTAC GCATACTACC GCATGGCGCT GGATGCGGGA 
ATCACCATGA CGCCCTGCCG ACTGTTCGAG GAAAACGGTC GTCGCCATTT TATGACGAGG 
CGCTTTGACC GGTTGGAGGA TGGAGGCAAA CTGCACATGC AGTCGCTCTG CGGCATAGCG 
CATTACGACT TCAATCAGGC GGGAGCATAC GGGTATGAAC AGGCGATGCA GGTCATTCGA 
CGCCTTGGTT TGCCGATGGC TTCCGTCGAG GAACAGTTCC GGCGAATGGT GTTCAATATC 
GTGGCCCGCA ATCAGGATGA CCATGTGAAG AACATTGCCT TTCTGATGGA CAGGTCGGGC 
AACTGGTCGC TTGCGCCAGC GTTCGATATT ACCTGGAGCT ATCAACCGGG GGGAGCGTGG 
ACATCGACCC ATCAGATGAC GATGAACGGC AAACGGAGCG GATTCCTGCC GGACTATTTC 
AAGGCATGTG CGAAAAGCGC ATCCATGAAA CGCGGGCGAG CCGAAACCAT CGTCGCTGAA 
GTGCAGGACG TTGTTCGCAG ATGGCATGAT TATGCCGAGG AGTCGCGCGT CACTCCCCGA 
CAACGGGATA AGATTGCAAC AACGCTGGGA CTGGAGGGCT TTGTATAA

Protein sequence

MSTTARVNLW GRTIGAVSLG SDAATATFEY DPAFVQSGIE IAPLTMPLSG QLYSFPSLRP 
ETFHGLPGLL ADSLPDRFGN ALIDAWLARS GRTPGSFNAV ERLCYTGSRG MGALEYAPAI 
RLGVSGSAPV EIERLVELAS EVLTHRNDLQ VWFHDEGKEL ALGEILRVGT SAGGARAKAV 
IAWNPETDEV RSGQVKAGKG FEYWLLKFDG VSGNKDKELE DPKGYGAIEY AYYRMALDAG 
ITMTPCRLFE ENGRRHFMTR RFDRLEDGGK LHMQSLCGIA HYDFNQAGAY GYEQAMQVIR 
RLGLPMASVE EQFRRMVFNI VARNQDDHVK NIAFLMDRSG NWSLAPAFDI TWSYQPGGAW 
TSTHQMTMNG KRSGFLPDYF KACAKSASMK RGRAETIVAE VQDVVRRWHD YAEESRVTPR 
QRDKIATTLG LEGFV