Gene Hneap_1084 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hneap_1084
Symbol
ID	8534231
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothiobacillus neapolitanus c2
Kingdom	Bacteria
Replicon accession	NC_013422
Strand	+
Start bp	1170821
End bp	1172185
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	56%
IMG OID	646383468
Product	cysteinyl-tRNA synthetase
Protein accession	YP_003262967
Protein GI	261855684
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0215] Cysteinyl-tRNA synthetase
TIGRFAM ID	[TIGR00435] cysteinyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.462524
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGGTTA TTTATGACTC CCACGCACGC GCCAAGCGTG AATTTGTGCC GATTAAACCG 
AAAACAGTGG GGATGTATGT TTGCGGCATG ACGGTTTATG ACCGCTGCCA CATCGGCCAT 
GCGCGGGTAA TGGTCGTGTT CGATATGGTT GTCCGTTACT TCAGGGCAAG TGGCTATGAG 
GTGCATTACG TGCGCAACAT CACGGATATC GACGACAAGA TCATTGCCCG TGCCGCCGAG 
AACAAGGAAA GTATTCGCAG CCTGACCGAG CGTTATATCG AAGCTATGCA TGATGACGCG 
GCCGCCTTGG GCTGCCTGTT ACCCACAGCT GAACCACGCG CTACCGAATC GGTAGGCGAT 
ATGGTGGCGA TGATCGAAAG CCTGATCGAG CGCGGCCACG CCTACCGTGC AGCCAATGGC 
GATGTGTACT TTGATGTCTC CACGTTTGAT CGATATGGCG AACTTTCCAA CCGTAATCCT 
GATGACTTAC GTGCGGGCGC GCGCGTTGAG ATCGACGAGG CGAAAACCGA TCCGCTCGAT 
TTTGTGCTCT GGAAGGCCGA AAAACCCGGA GATCCGAGTT GGGATGCGCC TTTTGGCCCC 
GGTCGTCCGG GCTGGCATAT CGAATGCTCG GCCATGTCGA CCCGCGCGCT GGGGGCGACC 
TTCGATATTC ACGGGGGAGG GCAGGATCTG CAGTTCCCGC ACCATGAAAA CGAAATCGCC 
CAAAGCGAGT GTGCGACGGG TCATCATTAC GTCAACTACT GGATGCACAA CGGCTTTGTG 
CGGATCAACG AAGAGAAGAT GTCCAAATCC CTGGGCAATT TTTTCACTGT GGCGGAGGTG 
ATGCGGCAAT ATCACCCGGA AGTGATTCGG TTGTTCGTGT TGTCCAGCCA TTACCGCAGC 
CCATTGAATT ATTCGGACCA GAATCTGGAT GCGGCGCGCG CCAGTCTGAC ACGCTGGTAC 
ACGGCTATAA AGGACGCACC CCAAAATGGA ACACCTAACC CGGAGGTTAT GGCGCGTTTT 
CGTGGGGTGA TGGACGACGA TTTCAATACA CCGGAAGCAT TGGCGATCGT GTTCGAGCAG 
ATCAGCGAAT TGAACCGCAG CAAGGATGCC AATTGCGCCG CGACGATAAA GGCCATCGGT 
GAAATCCTGA ATCTCGGACA GCACGATCCG GAAAGTTTTC TGCGTTGGGC ACCATCCTCT 
TCGGATCAAT TGAGCGACGA GGCGATTGAA CAGAAAATCG CCGAACGTGC TAGCGCGCGC 
GCCAACAAGG ATTTTGCGGC ATCGGACCGG ATTCGCGATG AGCTTCAGGC CGCAGGCATC 
GTGCTCGAAG ACAAGGCCGG GCAAACCACT TGGCGGCGCG GCTGA

Protein sequence

MLVIYDSHAR AKREFVPIKP KTVGMYVCGM TVYDRCHIGH ARVMVVFDMV VRYFRASGYE 
VHYVRNITDI DDKIIARAAE NKESIRSLTE RYIEAMHDDA AALGCLLPTA EPRATESVGD 
MVAMIESLIE RGHAYRAANG DVYFDVSTFD RYGELSNRNP DDLRAGARVE IDEAKTDPLD 
FVLWKAEKPG DPSWDAPFGP GRPGWHIECS AMSTRALGAT FDIHGGGQDL QFPHHENEIA 
QSECATGHHY VNYWMHNGFV RINEEKMSKS LGNFFTVAEV MRQYHPEVIR LFVLSSHYRS 
PLNYSDQNLD AARASLTRWY TAIKDAPQNG TPNPEVMARF RGVMDDDFNT PEALAIVFEQ 
ISELNRSKDA NCAATIKAIG EILNLGQHDP ESFLRWAPSS SDQLSDEAIE QKIAERASAR 
ANKDFAASDR IRDELQAAGI VLEDKAGQTT WRRG