Gene Hneap_1511 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hneap_1511
Symbol
ID	8534669
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothiobacillus neapolitanus c2
Kingdom	Bacteria
Replicon accession	NC_013422
Strand	-
Start bp	1643884
End bp	1645074
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	59%
IMG OID	646383901
Product	O-succinylhomoserine sulfhydrylase
Protein accession	YP_003263389
Protein GI	261856106
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0626] Cystathionine beta-lyases/cystathionine gamma-synthases
TIGRFAM ID	[TIGR01325] O-succinylhomoserine sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.00343011
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACCGAG TTGAAGACCC CCAATGGCAA CCCCAAACCC GGGCGATCCG GGTTGGCCAT 
CACCCAACGA ATGAAGGTGA ACACGGCGAG CCGATCTTCA CCACATCAAG CTTTCAGTTC 
GAATCGGCCG AGCAGGCTGC GGCCCGTTTT TCCGGCGCCG AACCCGGCAA TATCTATGCA 
CGGTTTACCA ACCCGACGAC CAAGGTGTTC GAAGATCGGT TGGCGGCCCT TGAAGGGGGC 
GAATCCTGCG TGGCGACCGG TTCCGGCATG GCCGCCATTC TCAGTACCTT CATGGCCTTG 
TGCTCGGCGG GCGATGAAGT GGTGGTGGCC CGACAGGTGT TCGGCACCAC TTCCGTGCTG 
TTCAACAAAT ACCTCGCGAA ATTCGGCTTG AAGGTCAAAT GGGTCGATTT GACCGACTGG 
TCGCAGTGGG AAGCCGCCAT CACGGACCTG ACCCGCTGGG TGTTCGTGGA AAGCCCATCC 
AATCCGTTGA CCGAAGTGGT CGATATCGCT CGTCTGGCAG AGTTGGCGCA TAAGCATGGT 
GCCGGTCTGA TCGTGGATAA TTGCTTCTGC ACGCCCATAC TCCAGCAGCC GTTGGCATTG 
GGTGCGGACA TCGTCATCCA TTCCGCCACG AAGTTTCTCG ATGGGCAAGG CCGGGCCATA 
GGTGGCGCTG TCGTCGGCAA TAAGAAATTA GTGGGTGAAG AGGTGCGCGG TTTTCTGCGG 
ACCTGCGGCC CCACTATGTC ACCGTTCAAT GCTTGGATTT TTGCAAAAGG CTTGGAGACC 
TTGGCCCTGC GCATGAAAGC GCACTGCGCC CACGCCAGCG CCGTCGCGGA TTTCCTGGCG 
GCTCACCCTC AGGTCAAACG CGTCTATTTC CCCGGGCTGT CCAACCACCC GCAAGCGGAC 
ATCATCGCCA GACAACAGTC AGGCCCGGGC GCGATCGTGT CCTTCGAGGT CGAAGGCGGG 
CAGGCGGCGG CATGGCGGGT AATCAATGCC ACGCAAATGA TTTCCATCAC AGCGAATCTG 
GGTGATGCCA AAACGACCAT CACCCATCCG GCCACCACCA CGCACGGACG TTTGACGCCC 
GAGCAGCGTA AAGAATCGGG TATTCATGAT GGGCTCGTAC GTCTGGCTAT TGGCCTTGAA 
GATCCCATCG ACATCATCCG GGATCTCAAG CGAGGCCTTG ATCGTGAATG A

Protein sequence

MNRVEDPQWQ PQTRAIRVGH HPTNEGEHGE PIFTTSSFQF ESAEQAAARF SGAEPGNIYA 
RFTNPTTKVF EDRLAALEGG ESCVATGSGM AAILSTFMAL CSAGDEVVVA RQVFGTTSVL 
FNKYLAKFGL KVKWVDLTDW SQWEAAITDL TRWVFVESPS NPLTEVVDIA RLAELAHKHG 
AGLIVDNCFC TPILQQPLAL GADIVIHSAT KFLDGQGRAI GGAVVGNKKL VGEEVRGFLR 
TCGPTMSPFN AWIFAKGLET LALRMKAHCA HASAVADFLA AHPQVKRVYF PGLSNHPQAD 
IIARQQSGPG AIVSFEVEGG QAAAWRVINA TQMISITANL GDAKTTITHP ATTTHGRLTP 
EQRKESGIHD GLVRLAIGLE DPIDIIRDLK RGLDRE