Gene Hneap_1103 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hneap_1103
Symbol
ID	8534251
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothiobacillus neapolitanus c2
Kingdom	Bacteria
Replicon accession	NC_013422
Strand	-
Start bp	1192748
End bp	1194049
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	54%
IMG OID	646383488
Product	urea ABC transporter, urea binding protein
Protein accession	YP_003262986
Protein GI	261855703
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence [TIGR03407] urea ABC transporter, urea binding protein

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATCGTC GTAACTTTAT GAAAGCCGTG GGCGCTACCG GATTGTCACT TAGTTTCGGC 
CTCAAGGGCA TCGAGTTTGC CAATGCCGCA GAAGGCCCAA TCAAGGTCGG TATTCTGCAT 
TCGTTATCCG GCACGATGGC CATCTCTGAG AGCGCACTCA AAGACAACAT GCTGATGTTG 
ATTGCCGAGC AGAACGCCAA AGGTGGTGTG ATGGGGCGCA AATTAGAGGC AGTCGTCGTC 
GATCCCGCAT CCAATTGGCC CCTGTTCGCG GAAAAGGCAC GCGAACTGAT CAGCAAGGAC 
AAAGTTTCCG CCATTTTCGG ATGCTGGACT TCCGTTTCCC GCAAATCCGT CCTGCCTGTC 
GTCGAAGAAC TCAATGGCCT GCTGTTCTAT CCCGTTCAGT TTGAAGGCGA AGAATCCTCG 
CGCAATATTT TCTACACCGG CGCGGCGCCA AACCAGCAAG CCATTCCGGC CGTTGATTAT 
TTGATGAACG AGCTTGGCAT TACCCGTTGG GTATTGGCGG GCACCGATTA CGTGTATCCG 
CGCACCACCA ACAAAATCCT GGAAGCCTAC CTCAAGCAAA AAGGTGTGAA GGACGAAGAC 
ATCATGATCA ACTACACGCC GTTCGGTCAG TCCGACTGGC AGTCGATCGT GAGCCAGATC 
AAGCAATTCG GCAGCGCGGG CAAACCCACC GCAGTTGTTT CCACCATCAA CGGCGATGCC 
AACGTGCCGT TCTATCGCGA ACTGGGCAAT CAGGGCATTC AGTCTCAGGA TATTCCCGTC 
GTTGCCTTCT CCGTGGGCGA ACAGGAACTC TCCGGCATGG ATACCAAACC ATTGGTCGGC 
CAACTGGCGG CCTGGAATTA CTTCGAAAGC GTCAAAACGC CAGAAAATGA AGCCTATATC 
GCCAACTGGA AGAAGTTCAA GAAAGACCCT AAAGCGGTGA CCAACGACCC GATGGAAGCG 
GAGTACATTG CCTTCCAGAT GTGGGTGAAG GCGGTTGAGA AGGCCAAATC CACCGACACG 
GACAAGATCC TCGAATCGAT CATCGGCGTG GAAGTGCCCA ATCTGACCGG CGGCACGGCC 
AAAATGCTGC CCAATCACTA CATCACCAAG CCGGTGTACA TCGGGGAAAT TCAGGATGAT 
GGACAGTTTG ATGTCGTCTG GAAAACCAAG ACCGAAGTGC CGGGCAAGGC ATGGTCCCCG 
TACCTGCCCG GCAGCAAGGA TCTGATTGCG GACTGGACAC CGCCGATCAA CTGCGGCGCG 
TACAACACCG TCACCAAGAA GTGCACAGGA TCAGGTTCAT AG

Protein sequence

MNRRNFMKAV GATGLSLSFG LKGIEFANAA EGPIKVGILH SLSGTMAISE SALKDNMLML 
IAEQNAKGGV MGRKLEAVVV DPASNWPLFA EKARELISKD KVSAIFGCWT SVSRKSVLPV 
VEELNGLLFY PVQFEGEESS RNIFYTGAAP NQQAIPAVDY LMNELGITRW VLAGTDYVYP 
RTTNKILEAY LKQKGVKDED IMINYTPFGQ SDWQSIVSQI KQFGSAGKPT AVVSTINGDA 
NVPFYRELGN QGIQSQDIPV VAFSVGEQEL SGMDTKPLVG QLAAWNYFES VKTPENEAYI 
ANWKKFKKDP KAVTNDPMEA EYIAFQMWVK AVEKAKSTDT DKILESIIGV EVPNLTGGTA 
KMLPNHYITK PVYIGEIQDD GQFDVVWKTK TEVPGKAWSP YLPGSKDLIA DWTPPINCGA 
YNTVTKKCTG SGS