Gene Hoch_6620 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_6620
Symbol
ID	8549037
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	+
Start bp	9076135
End bp	9077259
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	64%
IMG OID	646391280
Product	D-xylose transporter subunit XylF
Protein accession	YP_003270979
Protein GI	262199770
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4213] ABC-type xylose transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.00486776
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAGCGTA TCTCGCGTAC GAAGTCGATA GCCCCCTTGT TCGTTGCCGC ACTCGCCATG 
GTCGCGGTAC CCGGATGTAA GAAAGACGAA GAGGCGCCCG CCACGGGTGA AGGCGCCGAG 
GCCACCGGCG AAACGCCGGC CGAAGAGGGA CCGCTCAAAG TCGGTTTCCT GCTCAAGACC 
ATGCAGGAAG AGCGCTATCA GCGCGACAAG AAGGCCTTCA TCGACAAGGC GCAATCGCTC 
GGCGCCGAGG TGCTGTTCGA TTCGGCGAAC AACAACGAGC AAACCCAGCT CTCCAAATTC 
GAAACCATGC TCGCGCAGGG TGCCAAGGTG ATCGTGCTGC AGCCGGTCAA CACCGGCACC 
GCCGGCAACA TGGTCAAGAT GGCCAATGAG GAGGGCGTCC GCGTGGTCGG CTACGACTCG 
ATGCTGGTCA ACGGCCCGCT CGACGTCCAG GTCATGCAGG ATAGCTGGGC CGTCGGCAAG 
CTCCAGGGCG AGGCCATGGT CGAGTGGCTC AAGGCCAAGA ACGACGGCAA GGTCGAGGGC 
AAGGTCGCCC TGATCAAGGG CCAGCCCGGC GACTCCAACG CCAACGCCAT GTCCGAGGGC 
GCGCTGACCA TCATCAACGA GAACGAGGGC CTCGAGCTGG TCGCCGAGGA GTCGCACGAG 
GGCTGGTCGT CCGACAAGGC CATGGCCACC GCCGAGAACG TGCTGACCAA GTACGAGAAC 
GGCGTCGACG CCTTCATCGC CAACAACAGC GGCATGGCCC GCGGCGTCAT CGCGGCGCTG 
CAGAATCAGG GCCTCGACGA CGCCACCAAG GTGTTCGTCG CCGGCTCCGA CGCCGACCTG 
GTCAACATCC AGTACGTGGC CCAGGGCAAG CAGGCGGTCG AGATCTGGAA GAAGATCACG 
CCGCTGGCCG AGACCGCGGC CGAGATCGCG GTGACCCTGG CCAAGAGCCC CGACAAACCC 
GTGACCGAGC TGGTCGAGGC CGATCGCACC ATCAACAACG GCGCGGTCGA GGTGCCCACC 
ATCGTCACGC CGGTGGTGCT CGTGACCAAG GATAACGTCG AGGACACCGT GGTCGCCGGC 
GAGTTCTACA CCAAAGAGCA GGTCTTCGGC GCCGAGGCCG AGTAA

Protein sequence

MKRISRTKSI APLFVAALAM VAVPGCKKDE EAPATGEGAE ATGETPAEEG PLKVGFLLKT 
MQEERYQRDK KAFIDKAQSL GAEVLFDSAN NNEQTQLSKF ETMLAQGAKV IVLQPVNTGT 
AGNMVKMANE EGVRVVGYDS MLVNGPLDVQ VMQDSWAVGK LQGEAMVEWL KAKNDGKVEG 
KVALIKGQPG DSNANAMSEG ALTIINENEG LELVAEESHE GWSSDKAMAT AENVLTKYEN 
GVDAFIANNS GMARGVIAAL QNQGLDDATK VFVAGSDADL VNIQYVAQGK QAVEIWKKIT 
PLAETAAEIA VTLAKSPDKP VTELVEADRT INNGAVEVPT IVTPVVLVTK DNVEDTVVAG 
EFYTKEQVFG AEAE