Gene Hoch_3202 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_3202
Symbol
ID	8545590
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	4414261
End bp	4415301
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	70%
IMG OID	646387869
Product	ABC-type nitrate/sulfonate/bicarbonate transport systems periplasmic components-like protein
Protein accession	YP_003267597
Protein GI	262196388
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.0579972
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCACCC GCAGCCGAGC GCAGAAGTCA GCTTCGCCTT GGCGGCTGGG ATGCCTCCTC 
GGGCTGATGG TGGCGATGCT GCTCGGGTGT CGCGATTCGC GACCGCCGCT GCGCATCGGG 
CTCAACGATT GGGTGGGCTG CGGGTATCTG TTCGTGGCCG AGGAGCAGGG CTGGCTGAGC 
GCCGCGGGGA TGCGGGTCAA GTTCGTCGAG CTGGCCACCC TGTCCGACGT CGTCCGCGCG 
TTTGAGATCG GCCAGGTGGA CGTGATGTGC GTGAGTATCG CCGAGCTGAT GCGCGTCCAC 
GACAGCGCCC ACGCGCCGCG CGCCTTCTAT GTCGTCGACG TGTCCAGCGG CGCCGACGTG 
GTCCTGGCCC GCGAGCCCAT CCGCGCGGTC GCCGGGCTGC GCGGCAAGCG GGTGGCGGCT 
GAGCCCGGCA CCTTGACCAC CTTGTTGCTC GCGCGCGCGC TCGAGACCGC GTCGCTGCGT 
CTGGGCGACG TCACCCTGGT GGCCTCGGAT CAGGCGCGGG TGGTGAGTCA GTTCCAGGCC 
GGCGAGGTCG ATGCCGCGGT GACCTTTCCG CCGCGTTCGA GCCAGCTCGA GCGCCTCGGC 
GAGGTCAACC GGGTGTTCAG CAGCGCCGAC GTACTCGGCG AGATCGCCGA CGTGCTGGTC 
GCCACCGACG AGATATTCGC GCAGCGCAGC GACGAGCTCG ATATCCTGGT CCACGGCATG 
TATCGCGCGC TGGAGTTCAG CAAGCGCGAG CCCACGCTGA GCCGGGAGGT GATGGCGCGG 
CGGCTGGACA TGAGCGCGAG CGAGATCGCG GTGCATCTCG ATGGCCCGAT CACGCCGGTC 
GCTCTCGCTC AGCAGTGTGA GATGCTCGCG CCCGACGGAG TGCTGGCGCA GAGCCTGCGG 
CGCAGCGCCA TGCTCTTCGG CATCGCCAGC GCCAGCGAGG CCTCGTCGCT CGGCGCGTCA 
CTGCTCGACT GCAGCGCGGT CAAGCGCGTG CTCGACGATC TCGCCTCGGC CGGCCGCGAT 
GTCCGCCTCG GCGTTCGCTA G

Protein sequence

MGTRSRAQKS ASPWRLGCLL GLMVAMLLGC RDSRPPLRIG LNDWVGCGYL FVAEEQGWLS 
AAGMRVKFVE LATLSDVVRA FEIGQVDVMC VSIAELMRVH DSAHAPRAFY VVDVSSGADV 
VLAREPIRAV AGLRGKRVAA EPGTLTTLLL ARALETASLR LGDVTLVASD QARVVSQFQA 
GEVDAAVTFP PRSSQLERLG EVNRVFSSAD VLGEIADVLV ATDEIFAQRS DELDILVHGM 
YRALEFSKRE PTLSREVMAR RLDMSASEIA VHLDGPITPV ALAQQCEMLA PDGVLAQSLR 
RSAMLFGIAS ASEASSLGAS LLDCSAVKRV LDDLASAGRD VRLGVR