Gene Hneap_1404 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hneap_1404
Symbol
ID	8534560
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothiobacillus neapolitanus c2
Kingdom	Bacteria
Replicon accession	NC_013422
Strand	-
Start bp	1512690
End bp	1513883
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	58%
IMG OID	646383795
Product	Cupin 4 family protein
Protein accession	YP_003263285
Protein GI	261856002
COG category	[S] Function unknown
COG ID	[COG2850] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTGATTT CACAGGTGTT GGGTACCTTG TCCGTGGCGG ATTTTCTGCG TGATTACTGG 
CAGAAAAAAC CGGTGTTGAT CCGTCAGGGC GTGCCCGGCT TCGAATCGCC TCTATCTCCC 
GAAGAACTAG CCGGTCTGGC CTGTGAGGAA GACGTGCCCG CGCGCTTGAT TCTCGAATCG 
GCCGGCGCGC GGCCCTGGAC GTTGCGTCAT GGCCCATTCA CCGAAGCGGA CTTCACAAGC 
CTGCCCGAAG ACGGTTACTC GTTGTTGATC ACCGATTGCG AAAAGCTGAT CCCGGACTTG 
ATGAATTTGG TCCAGCACTT CCGTTTTGTA CCCGATTGGC GGATCGATGA CCTGATGATT 
TCCTACGCAC CACCCGGTGG TTCGGTCGGG GCGCATATCG ATGAATATGA TGTGTTCCTG 
TTGCAGGGGA TGGGGCGGCG CAAGTGGATG ATCGAGTATC CGCCGAAGCA CAGTGATTTT 
GTGCCAGATC TGGATATTCG CCTGCTGCAA GAATTCGAAC CGACCGAAGA ATGGGTGCTG 
GAACCGGGCG ACATGCTCTA TCTACCGCCC GGTGTGCCGC ATCACGGCGT AGCGGTCGAC 
CACTGCATGA CGTATTCGAT CGGCTTTCGT GCGCCCTTGC TGCACGAGAT GGCGGCTGGC 
GTCACCGACC GTCTGATTAC CGACATGGAT CAAGCGGCTC GTTACGGTGA TCCCGATTTG 
CAGGCACCTG CGAATCCCGG CGCATTGGAT GCCTCATCGC GTGTCAAGTT GCGCGCGATC 
TTGCAATCGG TACTCGATCA GGATGATGCC GTGCTGGATC GATTCATTGC CGAAACCCTC 
ACCGAGCGCC CGCTGGATCA CGCGGGTTTT TATCCACAAA ACGATCCTTT GGACGCGAAG 
GCCCTGCGCG GTGAAATCGC CCATAGCGGC GACACCCTCA TGCGCACACC GGCTGCGCGT 
TTGTTGCTGG TTGAAGATGA GCCCGATTCG GCTGGCGGTG CACTGGCCGT AGATGGTCAA 
AGCACGCTCT TGAATGCCGA AATGCTCCCC TTGGCGCGCT TGCTTGTGAG TCAGGTTTTT 
TATGATGCCG CCGAACTGCT GGCAGCCACC GAGTCTGAGG CCGCGGCTGA ACTTTTGCAG 
AAACTGTATG CCGATGGGGT GGTGCAGTGG CAGCCGAACT TGCTGAGTGT TTAA

Protein sequence

MVISQVLGTL SVADFLRDYW QKKPVLIRQG VPGFESPLSP EELAGLACEE DVPARLILES 
AGARPWTLRH GPFTEADFTS LPEDGYSLLI TDCEKLIPDL MNLVQHFRFV PDWRIDDLMI 
SYAPPGGSVG AHIDEYDVFL LQGMGRRKWM IEYPPKHSDF VPDLDIRLLQ EFEPTEEWVL 
EPGDMLYLPP GVPHHGVAVD HCMTYSIGFR APLLHEMAAG VTDRLITDMD QAARYGDPDL 
QAPANPGALD ASSRVKLRAI LQSVLDQDDA VLDRFIAETL TERPLDHAGF YPQNDPLDAK 
ALRGEIAHSG DTLMRTPAAR LLLVEDEPDS AGGALAVDGQ STLLNAEMLP LARLLVSQVF 
YDAAELLAAT ESEAAAELLQ KLYADGVVQW QPNLLSV