Gene Hoch_5303 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_5303
Symbol
ID	8547715
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	7293914
End bp	7295164
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	71%
IMG OID	646389977
Product	hypothetical protein
Protein accession	YP_003269681
Protein GI	262198472
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCTCGG CTCGCATGCA ACGCGCCCCC GCGCTCGCCC GCGTGCTCCG CGCGGGCGTC 
TTCACCGCCG CCGCCGCGCT CGGCGCGCTC GCGCTCGCGC TCGCGCCGCT GCCCCCCGGC 
GCGCCCGCCC TGCTGGCAGA CGCGGCCGCG CAGTCGCAGC CGCCCTCGTC GGCGTCGGGG 
TCGGCGCCAG CGCCCGACGA GCGCGACCCG GCCCCGGTCC CCGGCGACGA CAGCGAACGC 
GCGGACGCCG CGATCGCGGC CGCAGCGGAC AAGGACACCG ACTTCGCGGA CGACGCAGAC 
GACGCTGACG ACGCAGACGA CGCAGGCGAC GACGACACCG ATGCGCCTGT CGAAGATGGC 
GATCGGCCGT GGGCCGAGGG AGTGGCCGAG GCCGACCAGG AGCGCGCGCG TGCGCTCTAC 
GAGGAAGGCA ACGGGCTGAT GCGCGAGTAT CTGCTCGAGG AGGCGATGGA GAAGTATCGC 
CAGGCGCTCG CGCACTGGGA TCATCCGGCG GTTCACTACA ACCTGGCGCG CGTGCTCGAG 
AGTTTGAACC ACGCCGATGA GGCCGACTTC CACATGGAGT ACGCCCTGCG CTACGGCGCG 
GCCGCGTTCT CGGCGCAGCA GTATCCCCAG GTGCTCAACT TCCGGCGCGT GCTCGACCGC 
AAACTCGGAC ACCTGTCCTT GTTCTCTGAC GAGCGCGGCA TCGAGGTGCT GGTCGACGGC 
ACCGTGGTGC ACGCCGGCAT CGGTCAGGTG ACGCTGCGGC TGCTGCCGGG CGACCACGTC 
ATCACGGTGC GCAGCGACGA GGTCGCGCCG ACCACGCATC GCGTACACCT CGATCCCGGC 
GAACGCGTGC AGGTGACGCT GGCGACGCGC GTGCGCTGGC GCACCTGGGA ACCGTGGATG 
GTGCTCGGTC TCGGCGGTCT GGTGGCCACC AGCGGCGGCC TGATGCAGTG GGCCGCGTTC 
GAGAACAACG CGCGCTTTCG CGAGCGTTTC GCGGCCGAGT GCAACAGCGG CTGCAACGAC 
GAGAACAACG CACAGCTCGC GGCGCTGCGC GGACGCGCGC ACTGGCAAAA TCGCGTCGCC 
GTCGGCGCGA TGCTCACGGG CAGCGCGGTC ATCATCGCCG GCTCGCTGAT GCACGCGCTC 
AACCAGTCGC GCTTCGCCGA GATCGATGTC GGGCAACGCG ACAACGCGCT CACCGTGCTA 
CCCTCGGTCC ATTCGGATGG CGCCGGTTTT GCCGTCCATC TGTCCTTTTA G

Protein sequence

MISARMQRAP ALARVLRAGV FTAAAALGAL ALALAPLPPG APALLADAAA QSQPPSSASG 
SAPAPDERDP APVPGDDSER ADAAIAAAAD KDTDFADDAD DADDADDAGD DDTDAPVEDG 
DRPWAEGVAE ADQERARALY EEGNGLMREY LLEEAMEKYR QALAHWDHPA VHYNLARVLE 
SLNHADEADF HMEYALRYGA AAFSAQQYPQ VLNFRRVLDR KLGHLSLFSD ERGIEVLVDG 
TVVHAGIGQV TLRLLPGDHV ITVRSDEVAP TTHRVHLDPG ERVQVTLATR VRWRTWEPWM 
VLGLGGLVAT SGGLMQWAAF ENNARFRERF AAECNSGCND ENNAQLAALR GRAHWQNRVA 
VGAMLTGSAV IIAGSLMHAL NQSRFAEIDV GQRDNALTVL PSVHSDGAGF AVHLSF