Gene Hoch_5079 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_5079
Symbol
ID	8547490
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	7001330
End bp	7003411
Gene Length	2082 bp
Protein Length	693 aa
Translation table	11
GC content	71%
IMG OID	646389755
Product	Integrin alpha beta-propellor repeat protein
Protein accession	YP_003269460
Protein GI	262198251
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGTGCA CGAGTTCAAG ACACAAACGC ACGCATGCTG AGCCTACGCA TGCCCTCGCC 
GTCGCGGCGG CAACCGGCGC CGCCCTCGCG CTGCTCAGCG GTTGCGCCCA GGTCCTGGGC 
ATCGACGAGC TCTCGCCCGG AGCGGGCGCC GGCCGCGTTA CCCTGCGCGG CACGGCCAGC 
GGCGTACTCG CGCCCGTGAG CCTGCGCCTC ACCCACCCCG GCGGCAGCGA GGAGCTGCGC 
GTGGACGGCG ACGGCGCGTT CGGGTTTTCG ACCGAGCTGT CGAAGGGCGA CATCTACGAG 
GTCGCGATCG CGGCCGCCGA GGACGCGCAG CCGTGCGCGC TCGACCACGC CGCGGGCACG 
GCCGACAGCG ACGCGGACGA GTCGCAGCGC GGTCTCGAGC TGGCCTGTGG GCCAACGTTG 
CTCACCGAGC TGAGCATCGC GGACGTGGAC GCGCTGCCGT TTGAGCTCGG ACGCGCGGAC 
TATGACCTCA GCGTGCCGCT GCTGCAGCGC TCGCTGCAGA TCACGGCGGC GGCCGCGCAT 
CCCGATGCCG AGCTGCGCAT CGACGGCACG CCGGTGGCCG CGGGCACACC TGGCCCGCCC 
ATCGCGCTGC CCCTCGGCGC CAGCGAGATC GTGCTCGAAC TCGGCCTCGC CGGCGGCAGC 
GCGCGCAGCT ACCGGCTGCA CGTAGCGCGC GAGGCCGCAG CCCTGCAGCG CGCCTACGGC 
AAAGCGGAAA ACGGCGACGG CGAGGACGCC TTTGGCTTCA GCATGGACCT CGCCGGCGAG 
CTCCTGGTCG TCGGCGCCCC CTACGAGGAC AGCGCCGCGC GCGAGGTCGA CGGCGACGGC 
GACAGCGACG CAGCCAGCGA CAGCGGCGCG GTCTACATCT TCCGCCGCGA CGGCGAGAGC 
TGGGTCGAGG AGGCCTATCT CAAGCCGCGC AACGGCGCCG CGGGCGACAA TTTCGGCCAC 
TCGCTGGCCA TCTCGGGCGA TACCCTCGCG ATCGGCGCGC CCTTCGAGGA CAGCGCCGCG 
CGCGGCTCCT TTGCCGACAG CGGCGCCGCC ACCGACGATG ACGCCGGCGA CAGCGGCGCG 
GTCTACATCT TCGTCCGCGA CGGCGGGCGC TGGCGTGAAG ACGCCTATCT CAAAGCCCAC 
AACGGCGACC CCGCCGACAA CTTCGGCTGG GCCGTGGACC TCGACGGCGA CACCCTGGCC 
GTGGGCGCGC GCTTCGAGAG CGGCGGCACG ACCGGCGTCG GCGGCGGCAG CGACGGCCTC 
GATGACGAGC GCGTCGGCAA GAGCGGCGCG GTCTACGTGT TTCACCGCGA TGGCGGCTGG 
CAGCAAGAGG CCTACGTCAA AGCCTCCAAC ACCGGGCGCG AGGACAATTT CGGCCGCAGC 
CTCAGCCTCG ACGGCGACAC CCTCGCGGTC GGCGCCCGCT TCGAGGACAG CGACGGCGCC 
GGCGTCGATG GCGCCCAGGA CAACGACGCT CGCGTCAACA GCGGCGCGGT CTACGTGTTT 
CGCCTCGCCC GCGGACGCTG GGCGCAAGAG GCGTACCTCA AAGCCTCGAA CCCCGCCTTC 
GAGGACAACT TCGGCCTCAG CCTGGCGCTC GCCGGCGACC TCCTGGCGGT GTCCGCGCCC 
TACGAGGACA GCGCGGCCAC CGGCGTCGAT GGTGACCAGG GCGACGACTC AGCCGAAGAC 
AGCGGCGCCG TGTACCTATT CGAGCGCAGC GATAGCACCT GGAAACAGGC AGTTTATCTC 
AAAGCTAGTA ATTCCGGCCA GGGGGACAAT TTCGGTTGGA GCCTGGACGC GGCCGGTGAC 
CTGGTCGCCA TCGGCGCGCT CGGCGAGTCC GGCGTCGACG ACGGCAGCCC GCAGGGCGGC 
GCCGCCTACC TGCTCGGACG CGACGAGCGC GGCTGGCGCG AGTTCGACCT GCTGCGGGCC 
TCCAACGCCG AGGAATACGA CTGGTTCGGA TATGCCGTCG CGTTGGGCGA AGGCCGACTC 
GTTGTCAGCG CTCGCGACGA GGACAGTGCA TCTCAGGGCT GGGACGGCGA GCAGACCAAT 
AACAGTGCCG CCAACAGTGG GGCGGTTTAC GGATACGAGT GA

Protein sequence

MMCTSSRHKR THAEPTHALA VAAATGAALA LLSGCAQVLG IDELSPGAGA GRVTLRGTAS 
GVLAPVSLRL THPGGSEELR VDGDGAFGFS TELSKGDIYE VAIAAAEDAQ PCALDHAAGT 
ADSDADESQR GLELACGPTL LTELSIADVD ALPFELGRAD YDLSVPLLQR SLQITAAAAH 
PDAELRIDGT PVAAGTPGPP IALPLGASEI VLELGLAGGS ARSYRLHVAR EAAALQRAYG 
KAENGDGEDA FGFSMDLAGE LLVVGAPYED SAAREVDGDG DSDAASDSGA VYIFRRDGES 
WVEEAYLKPR NGAAGDNFGH SLAISGDTLA IGAPFEDSAA RGSFADSGAA TDDDAGDSGA 
VYIFVRDGGR WREDAYLKAH NGDPADNFGW AVDLDGDTLA VGARFESGGT TGVGGGSDGL 
DDERVGKSGA VYVFHRDGGW QQEAYVKASN TGREDNFGRS LSLDGDTLAV GARFEDSDGA 
GVDGAQDNDA RVNSGAVYVF RLARGRWAQE AYLKASNPAF EDNFGLSLAL AGDLLAVSAP 
YEDSAATGVD GDQGDDSAED SGAVYLFERS DSTWKQAVYL KASNSGQGDN FGWSLDAAGD 
LVAIGALGES GVDDGSPQGG AAYLLGRDER GWREFDLLRA SNAEEYDWFG YAVALGEGRL 
VVSARDEDSA SQGWDGEQTN NSAANSGAVY GYE