Gene Hoch_4033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_4033
Symbol
ID	8546434
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	5537757
End bp	5538881
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	70%
IMG OID	646388710
Product	OmpA/MotB domain protein
Protein accession	YP_003268425
Protein GI	262197216
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2885] Outer membrane protein and related peptidoglycan-associated (lipo)proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.659004
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.277798
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCAGG CCCTGCGCGC GGACGCGCGG ACGACTTCGC GGCTGCCGCG GCCGACGCGC 
GCGCTGGCGG CGATGGTGCT GGCGGCGCTC ATGGCGCTGG CCGGCGGCTG CGGCGGTGGC 
GCCGAGCTGC GCGGCCGCAG CCAGACGGTG GACTCGCTGG TGGCCACGGC GCGCGAGAAC 
GGCGCCGAGC GTTGCGCGCC GGTAGAGCTG GCGCTGGCCG AGAGCCACGT GGCCTTTGCC 
AAGCAAGACC TCGACGAAGG CGATCCATTC CGCGCCCGCC GCGAGCTGGA GATCGCCGAG 
AGCAACGCCC GCGAGGCGCT GCGCCTGTCG CCCAAGGATC CCTGCGTGCC GCCCGAGGTG 
GTCGCCGTGG ACAGCGACGG CGACGGCATC TTCGACGATC GCGACGCGTG CAAGGGCGCG 
CCCGAGGACA AGGACGGCTT CGAGGACGAG GACGGCTGCC CCGACCTCGA CAACGATCAG 
GACGGCATCG TCGACGCCAG CGACGCCTGC CCGCTCGAGC CCGAGGACAA GGACGGGCTC 
GACGACGAGG ACGGCTGCCC CGAAGAGGAC CGCGACGGCG ACATGATCGC CGACAACAAG 
GACCAGTGCC CGGACGAGCC CGAGGACAAG GACGGCTTCG CCGACGAGGA CGGCTGCCCC 
GACTGCGACA ATGACGGCGA CGGCGTGCCC GAGTGCCCGG TGGTCGTGGA CCAGTGTCCG 
AGCAAGGCGG CCAAGACCCC GGACGGCTGT CCGGTTTACA ATCTGGTCAA GGTCACCTCG 
AAGAAGATCG AGATCAAGCA GACCATCTAC TTCGAGACCG GCAAGAACAC CATCAAGCCG 
GTGTCCTTTG CGCTGCTCAA CGAGGTGGCC ACGGTGCTCA CCGACAACCC CGAGATCGAG 
GTGCGCATCG AGGGTCACAC CGACAGCCGC GGCAGCGCCG AGTTCAACAT GGAGCTGAGC 
CAGAGCCGGG CCGAGTCGGT GCGCAGCTTC CTCATCGACA AGGGCGTGGA CGGCGACCGC 
CTCGAGGCCA AGGGCTACGG CGAGAGCGCG CCCATCGCCA ACAACAACAC CCGCGCCGGC 
CAGGCCCAGA ACCGGCGCGT GGAGTTCGTG ATCGTCAGCC GTTAG

Protein sequence

MSQALRADAR TTSRLPRPTR ALAAMVLAAL MALAGGCGGG AELRGRSQTV DSLVATAREN 
GAERCAPVEL ALAESHVAFA KQDLDEGDPF RARRELEIAE SNAREALRLS PKDPCVPPEV 
VAVDSDGDGI FDDRDACKGA PEDKDGFEDE DGCPDLDNDQ DGIVDASDAC PLEPEDKDGL 
DDEDGCPEED RDGDMIADNK DQCPDEPEDK DGFADEDGCP DCDNDGDGVP ECPVVVDQCP 
SKAAKTPDGC PVYNLVKVTS KKIEIKQTIY FETGKNTIKP VSFALLNEVA TVLTDNPEIE 
VRIEGHTDSR GSAEFNMELS QSRAESVRSF LIDKGVDGDR LEAKGYGESA PIANNNTRAG 
QAQNRRVEFV IVSR