Gene Cpha266_1747 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpha266_1747
Symbol
ID	4571109
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides DSM 266
Kingdom	Bacteria
Replicon accession	NC_008639
Strand	-
Start bp	1973891
End bp	1975072
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	53%
IMG OID	639766330
Product	secretion protein HlyD family protein
Protein accession	YP_912188
Protein GI	119357544
COG category	[V] Defense mechanisms
COG ID	[COG1566] Multidrug resistance efflux pump
TIGRFAM ID	[TIGR01843] type I secretion membrane fusion protein, HlyD family

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.570517
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATAGTC AAAAAGAAGA AGGAGAAAAA CAGCCTGTTG CGACTGAAAA GGCTGCCGAA 
GTTCACGTTA AAAGCTATCG GGATACCGGC AGTACGATCC GTCTCGGAAT ATGGATACTT 
CTTGTCGGCT TTGGCGGTTT TCTGTTGTGG GCGGCATTTG CACCGCTTGA CGAAGGAGTT 
CCCTGCCAGG GCGTTGTCAG TATTGCTACC AAGCGAAAGG TCGTTGAGCA TCTTCGAGGT 
GGTACCGTTG AGAAGGTTGA GGTGCGGGAA GGTCAGATCG TACAGGAGGG AGAGGTGCTG 
ATGAGACTTG ACAGCCAGAC GGCAAGGGCG CGGTACGATG AGATTCATCA GCACTATATC 
GGTACAAGAG CTACGGCAGA CAGGCTGCTT GCGGAGATGA GCGGAGCAGG ATCAATTGCT 
TTTCACCATG ATCTTCTTGC CGATCCGGAT CGAACTCTTG CCGAACAGAA TATGCGGACA 
CAGAGGCAGC TTTTTCTCTC CCGCCAGGTT ACGCTAAGGA TTCTCAATGA ACAGCTCTCT 
GGTATTGTCT CGCTTGTCAA GGAAGGTTAT GCCCCCTTGA GTCAGCAGCA CGAGCTGGAG 
CTGAAGATTG CAGAGCTGAA GAGTGCAACA GCCTCGCAAC TCGCACAGGT GCAGCTTGAA 
GTAGAAGCCG ACGCGGAAAA GACTCGAGCC CTTGCTGAAG AGCTTGCCGA TACTGAACTC 
CGATCTCCCG CCTCAGGACA GGTGGTGGGC CTGCAAGTAC AGACCGTTGG TGCCGTGATT 
CAGCCAGGTC AGAAGGTTAT GGATATCGTT CCGCTTCATG AAGGCCTGCT CATAGATGCC 
AAGGTTGCCC CGCATCTGAT CGACAGCATC CGTAAGGGAC TGCCGGTGGA CGTGAGCTTT 
TCCTCATTTG CACATGCGCC CCAGCTTGTT GTGCAGGCTG TGGTTGCTTC GATCTCAAAA 
GATATTATTA CGGACCCGCA GACAAACCCG TCGATGCCTG GAGCCTCCTA TTACCTTGCC 
CGGATTGCGG TGACCCCGCA TGGACTCAAC TCTCTCGGAA ATCGTCAGAT GCAGCCGGGA 
ATGCCGGTAC AGGTGGTTAT TAAAACCGGG GAACGTTCCC TGCTGACCTA CCTGATTGAT 
CCGCTGCTCA AGCGGATTAC AGTCTCCATG AAGGAGGAGT GA

Protein sequence

MHSQKEEGEK QPVATEKAAE VHVKSYRDTG STIRLGIWIL LVGFGGFLLW AAFAPLDEGV 
PCQGVVSIAT KRKVVEHLRG GTVEKVEVRE GQIVQEGEVL MRLDSQTARA RYDEIHQHYI 
GTRATADRLL AEMSGAGSIA FHHDLLADPD RTLAEQNMRT QRQLFLSRQV TLRILNEQLS 
GIVSLVKEGY APLSQQHELE LKIAELKSAT ASQLAQVQLE VEADAEKTRA LAEELADTEL 
RSPASGQVVG LQVQTVGAVI QPGQKVMDIV PLHEGLLIDA KVAPHLIDSI RKGLPVDVSF 
SSFAHAPQLV VQAVVASISK DIITDPQTNP SMPGASYYLA RIAVTPHGLN SLGNRQMQPG 
MPVQVVIKTG ERSLLTYLID PLLKRITVSM KEE