Gene Nham_4081 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nham_4081
Symbol
ID	4025618
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrobacter hamburgensis X14
Kingdom	Bacteria
Replicon accession	NC_007959
Strand	+
Start bp	44217
End bp	45602
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	62%
IMG OID	637964660
Product	twin-arginine translocation pathway signal
Protein accession	YP_571568
Protein GI	92109280
COG category	[R] General function prediction only
COG ID	[COG2041] Sulfite oxidase and related enzymes
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGAAAA TGCAGATGTT CAAATCTCAT GAACGTTCGG TAGAGCGCTC GCTTGACGAA 
CTTTACAACG ACGATGCCGA ACGCGCGGAT GCCGAGGTAT TCGGCCGGAA AGTCTCCGCG 
AGCCGCCGCG GTTTTCTCGG CGGAGCCGGC CTTGCCGCGA TGAGCGCGGC GGTTGGTGGT 
GCGATCCCAT TTGCTGCCAA TATGCCGGGC GGGCTGATTC CAGCGGCGCT CGCGCAAAAT 
GCGCCTGCTG CCGGCGAGTC TCCAGCCCCG GCGCCGAAAG GGCCGCAGCA TTTACAGTTT 
CCTGGTAAGA GTGATGGGCT CGTTGTGCTC GGTGATCGGC CACTGGTGGC GGAGACGCCA 
GAGAACCTGC TCGACGACGA CACCACGCCG ACCGACAAAC TGTTCGTGCG CAACAACGGC 
CAGATTCCGG AGGAAAGCAA GGACCCGGAT AAGTGGTCCT TCGTCATCGA TGGCGAGGTC 
AACAACAAGC TGACGCTGAC GCTTGGCGAA CTCAAGGCGA AGCACAAGCC GGTCACCCGC 
CGTCTGGTGC TCGAATGCGG CGGCAACGGC CGCTCCTTCT TCACGCCGCA GGCGCGCGGC 
AACCAGTGGA CCAATGGCGG CGTCGGCTGT CCGGAATGGA CCGGCGTCAA GCTTGCGGAC 
ATCATCAAGA GCGCCGGACT GAAGCCGTCG GCGGTGTTCT CCGGCCATTA CGGCCGCGAC 
CTGCATCTCT CCGGCGACGA GAGCAAGCCG ACATTGTCGC GCGGTGTGCC GATCAAGAAG 
CTGATGGATG AGAACAACCT CATCGTCTTC GCGCTGAACG GCAAGCCGCT GCCGAACATT 
CACGGTGGGC CGGTGCGACT GTTCATTCCC GGCTGGCCGG GATCGCTATC GGCGAAGTGG 
CTGAGCCGCA TCTGGATCCG CGACAAGGAG CACGACGGCC CGGGCATGAC TGAGTTCGCT 
TATCGCGTGC CGATCAAGCC GATGATCCCC GGCGCCAAGG GCGATCCGAA GAATTTCCAG 
ATTCTGGAAT CCATGCCGAT ACGCTCGATC ATCACCAGTC CCGCCAACGG CGATAAAATC 
GCCGCCGGCA CCAAGGAGAT CAAGCTGCGT GGCGCGGCCT GGGCCGGCGA CTTCACCGTC 
GATCACGTCG ATGTCTCGAC CGATTTCGGC GCGACCTGGA CGCGGGTTAA GCTGTCGAAG 
CCGAAGAACA AGTACGACTG GCAGCGCTGG ACCACGACCG TGAAACTGCC GACCGACGGC 
TATTATGAAA TCTGGGCGCG CGGCACCGAC TCGAGGGGCG TCATGCAGCC GCATATGGCC 
GGTTTCTGGA ATCCGCAGGG CTATGGCGGC AACGCCATGC ACCGGATTGC TGTTTTGGTG 
GGTTGA

Protein sequence

MSKMQMFKSH ERSVERSLDE LYNDDAERAD AEVFGRKVSA SRRGFLGGAG LAAMSAAVGG 
AIPFAANMPG GLIPAALAQN APAAGESPAP APKGPQHLQF PGKSDGLVVL GDRPLVAETP 
ENLLDDDTTP TDKLFVRNNG QIPEESKDPD KWSFVIDGEV NNKLTLTLGE LKAKHKPVTR 
RLVLECGGNG RSFFTPQARG NQWTNGGVGC PEWTGVKLAD IIKSAGLKPS AVFSGHYGRD 
LHLSGDESKP TLSRGVPIKK LMDENNLIVF ALNGKPLPNI HGGPVRLFIP GWPGSLSAKW 
LSRIWIRDKE HDGPGMTEFA YRVPIKPMIP GAKGDPKNFQ ILESMPIRSI ITSPANGDKI 
AAGTKEIKLR GAAWAGDFTV DHVDVSTDFG ATWTRVKLSK PKNKYDWQRW TTTVKLPTDG 
YYEIWARGTD SRGVMQPHMA GFWNPQGYGG NAMHRIAVLV G