Gene Hoch_6447 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_6447
Symbol
ID	8548862
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	8849417
End bp	8851222
Gene Length	1806 bp
Protein Length	601 aa
Translation table	11
GC content	67%
IMG OID	646391108
Product	sulfate adenylyltransferase, large subunit
Protein accession	YP_003270809
Protein GI	262199600
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2895] GTPases - Sulfate adenylate transferase subunit 1
TIGRFAM ID	[TIGR00231] small GTP-binding protein domain [TIGR00485] translation elongation factor TU [TIGR02034] sulfate adenylyltransferase, large subunit

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.832867
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCGCCC GCGAGACTAT GAACGTGGTC ATCGTCGGCC ACGTGGATCA TGGCAAATCG 
ACGCTCGTCG GCCGTCTGCT GGCCGACACC GGCACCCTCG GCGAGGGCAA GCTCGAGAAG 
ATCCAGGCGG TCTGCAAGCA GCAGGGCAAG AAGTTCGAGT ACGCCTTTTT GCTCGACGCG 
CTCGAGGAGG AGCAGGGCCA GGGCATCACC ATCGACTCGG CCCGCGTGTT CTTCCGCTCG 
GACCGGCGCG ACTACATCAT CATCGACGCG CCCGGACACA TCGAGTTCCT CAAGAACATG 
GTCTCGGGCG CGGCGCGCGC CGAGGCCGGC GTGCTGCTCA TCGACGCCAA AGAGGGCGTG 
CGCGAGAACA GCCGCCGCCA CGGCTATCTG CTGTCGATGC TGGGCATCAA GCAGATCGTC 
GTCGCGGTCA ACAAGATCGA CCTGGTCGAT TACAGCAAAG AGGTGTTCGA GCGCATCGTC 
GACGAGTACC GGGCGTTCTT GCGCGAGGTC GAGATCGAGC CCACGCACTT CATCCCCGTG 
AGCGCGCGCG AGGGCGACTT CGTGGTGTCG CGCTCGGACA AGCTCGACTG GTTCGACGGG 
CCCACGATCC TCGAGGCCGT GGACAGCTTC GAGAAGGCCA AGCCCAGCGC CGAGCTGCCG 
CTGCGCATGC CGGTGCAGGA CGTCTACAAG TTCAACGAGC GCGGCGACGA CCGCCGCATC 
ATCGTCGGCC GCGTCGAGTC GGGCACGCTC AAGCCCGGCG ATCGGGTGGT GTTCTCGCCC 
TCGTACAAGT CCACGACCAT CGAGTCGATC GAGACCTTCC ACGCCGATGC GCCGAGCGCG 
GTCGAGGCCG GGCGCACCAC GGGCTTCACG CTCACCGAGC AGATCTACGT CAGCCGCGGC 
GAGATCATGC ACCACGCCGA CACGCCGCCG GATGTGTCGA CCAAGCTGCG CGTCAACCTG 
TTCTGGCTCG GCAAGCGGCC CATGGTCCCC GGGCGGCGCT ACAAGCTCAA GCTGGCGACC 
TCGGACACCG AGGTGACCAT CGACAAGATT CACCGCATCC TCGATGCCGG CGATCTCACC 
GCCACCGACA CCAAGGAGAT GGTCGAGCGC CACGACGTCG CCGACCTGGT GCTGCGCACG 
CGCCACCAGA TCGCGTTCGA CATCGCGCGT CAGATCGAGG CCACCGGCCG CTTCGTGATC 
GTCGATGAGT TCGACATCGC CGGCGGCGGT ATCGTGCGCG AGGCGGTGGA TGACGAGGTC 
GCCGACCGCC GGCTCGAGTA CCGCATCCGC GGCACCGAGT GGGTGCGCGG CGACATCACC 
CCCGACCAGC GCGCCGACAT CAACGGCCAC CCGGCGAGCA TGGTGATGCT CACCGGCGAG 
GTCAACACCG GCAAGCACGA GGTCGCGCGC GCGCTCGAAT ACGCCTTGGT GCGCACCGGC 
CACCACGCCT ACCTGCTCGA CGGCAAGAAC GTGGTGCTCG GCGTCGACGC CGATATCGCC 
TTCGACGACA TCGACGAGCT GGTGCGTCGC TTTGGCGAGG TCGCCCATAT CCTGCTCGAT 
GCCGGTCACG TGGTCATCTC GACGACCAAC GTCATCGGCC TCACCGACCA CCTGGGCATT 
CAGGTGCAGA TTTCGCCCTT CAAGATGTTC GTGGCGCACC TGGGCCCGGA GGCGGAAGGA 
CTGCCCGAGG GGGCGGATCT GCGTCTCGAT CCCGAGCCCG ATGTCGAGTC GGCAGTCGCC 
GCGATCGTGG GCGAGTTGGG TCGGCGCGCG CGCCTCATCC CCGACAAGCA ACGGCGCGAG 
CGCTGA

Protein sequence

MVARETMNVV IVGHVDHGKS TLVGRLLADT GTLGEGKLEK IQAVCKQQGK KFEYAFLLDA 
LEEEQGQGIT IDSARVFFRS DRRDYIIIDA PGHIEFLKNM VSGAARAEAG VLLIDAKEGV 
RENSRRHGYL LSMLGIKQIV VAVNKIDLVD YSKEVFERIV DEYRAFLREV EIEPTHFIPV 
SAREGDFVVS RSDKLDWFDG PTILEAVDSF EKAKPSAELP LRMPVQDVYK FNERGDDRRI 
IVGRVESGTL KPGDRVVFSP SYKSTTIESI ETFHADAPSA VEAGRTTGFT LTEQIYVSRG 
EIMHHADTPP DVSTKLRVNL FWLGKRPMVP GRRYKLKLAT SDTEVTIDKI HRILDAGDLT 
ATDTKEMVER HDVADLVLRT RHQIAFDIAR QIEATGRFVI VDEFDIAGGG IVREAVDDEV 
ADRRLEYRIR GTEWVRGDIT PDQRADINGH PASMVMLTGE VNTGKHEVAR ALEYALVRTG 
HHAYLLDGKN VVLGVDADIA FDDIDELVRR FGEVAHILLD AGHVVISTTN VIGLTDHLGI 
QVQISPFKMF VAHLGPEAEG LPEGADLRLD PEPDVESAVA AIVGELGRRA RLIPDKQRRE 
R