Gene Jann_3042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Jann_3042
Symbol
ID	3935513
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Jannaschia sp. CCS1
Kingdom	Bacteria
Replicon accession	NC_007802
Strand	+
Start bp	3068903
End bp	3070576
Gene Length	1674 bp
Protein Length	557 aa
Translation table	11
GC content	61%
IMG OID	637905413
Product	nitrate transport ATP-binding subunits C and D
Protein accession	YP_510984
Protein GI	89055533
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1116] ABC-type nitrate/sulfonate/bicarbonate transport system, ATPase component
TIGRFAM ID	[TIGR01184] nitrate transport ATP-binding subunits C and D

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.499138
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.908503
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCATGTC TTGAGCTGAA AAATGTGTCC AAAAGCTATG GCGAAACGCC CGTGCTGAGC 
GACATTAACC TTGAGATCAA GGAGGGGGAA TTTCTGGTCC TTCTGGGATT TTCGGGCACC 
GGAAAGACGA CGCTGATCAA CCTGATGGCG GGCCTGGAGG CACCGTCGAA GGGAGAGGTG 
ACGTTCAAGG GCGCCCCGGT GGTTGAACCG GGCCCGGAGC GCGGCGTGAT TTTCCAGAAC 
TATTCGTTGA TGCCGTGGTT AACGGTGGCG GGGAATGTGG GGCTGGCCGT GGACACGATG 
TTTGGCGATC TGCCCAGGGC AGAGCGCGCC AAGAGGGTGG ACCGCTACGT GGATATGGTG 
GGGCTGACGC CTGCTGCCAC GCGCCGCCCG GCGGAATTGT CCGGCGGGAT GCGGCAGAGG 
GTGAACGTGG CACGGGCCTT AGCGATGGAC CCCGAAATGC TGCTGCTGGA TGAGCCGTTG 
AGCGCGCTGG ATGCGCTGAC AAGGGCGAAT TTGGCGGAAG AGATTGAGAG GATCTGGGAG 
GCCAGCAAAA AGACCTGCGT GCTGATCACA AACGATGTGG ATGAGGCGAT CTTGCTGGCG 
GATCGGATCA TTCCGATGAA CCCCGACGGC ACTTTGACGG ACGCGTTCGA GGTGGGCATT 
GCACGCCCCA GGGACCGGGT CGCGATGAAC ACAGACGCCG AGTTCATTCG CCTGCGCGCT 
GAGGTCACGA AGTACCTGAT GGATGTGGGG ATCGAGGCGA AGGTGGAAGG CACGCGCGTG 
CTGCCCGAGG TGACGCCGAT CCACGGCGTG CCTTTGGCGG TAGCGAATGC CGCGCAAACG 
GCGCTGGAAG AGAGGTATCT GGAATTCTCC AAGGTCCATA AGGTTTACCC GACGCCGAAG 
GGCCCGCTGA CAGTGGTCGA AGATTTCGAC CTGAAGCTGC GCCGGGGGGA ATTTATCTCG 
CTGATCGGGC ATTCGGGCTG CGGTAAATCC ACGGCGCTGA CGATGGTGGC GGGGCTCAAC 
CCGATCTCCA AGGGCGCGAT CAAGCTGGAC GGACGCGCTG TTGAGGGCGC GGATCCGGAG 
CGGGCGGTGG TGTTTCAGTC CCCGTCGTTA TTCCCATGGC TATCTGCCCG CGAAAACTGC 
GCGATTGGGG TGGATAAGGT CTACCCCAAA GCGTCGCGGG CGGAGCGGCA GGATGTGGTG 
GATTACTACC TTGAACGGGT GGGTCTTGCC GACGCGATGG ACAAGCGTGC GGCCGACCTG 
TCCAACGGCA TGAAACAGCG CGTGGGCATT GCGCGGGCCT TTGCCCTTTC CCCCAAATTG 
CTGCTGCTCG ATGAGCCGTT TGGCATGCTC GACAGCCTCA CCCGGTGGGA GCTGCAAGAG 
GTCCTGATGG AGGTCTGGTC GCGCACCAAA GTCACCGCGA TTTGCGTCAC CCATGATGTG 
GATGAGGCCA TTCTTTTGGC CGACCGTGTT GTCATGATGA CCAACGGGCC GCAGGCGACC 
ATCGGCAAGA TCACGGATGT GAACCTGCCC CGCCCGCGCA CCCGCAAGGC GCTGTTAGAG 
CACCCGGATT ACTACAGCTA CCGCCAGGAT GTCCTCGATT TCCTTGAGGA ATACGAGCAT 
GGCGCGAAAC CCAGACCAAA AGCCGCAGCG CCCAAAGCTG TCGCGGCGGA GTGA

Protein sequence

MACLELKNVS KSYGETPVLS DINLEIKEGE FLVLLGFSGT GKTTLINLMA GLEAPSKGEV 
TFKGAPVVEP GPERGVIFQN YSLMPWLTVA GNVGLAVDTM FGDLPRAERA KRVDRYVDMV 
GLTPAATRRP AELSGGMRQR VNVARALAMD PEMLLLDEPL SALDALTRAN LAEEIERIWE 
ASKKTCVLIT NDVDEAILLA DRIIPMNPDG TLTDAFEVGI ARPRDRVAMN TDAEFIRLRA 
EVTKYLMDVG IEAKVEGTRV LPEVTPIHGV PLAVANAAQT ALEERYLEFS KVHKVYPTPK 
GPLTVVEDFD LKLRRGEFIS LIGHSGCGKS TALTMVAGLN PISKGAIKLD GRAVEGADPE 
RAVVFQSPSL FPWLSARENC AIGVDKVYPK ASRAERQDVV DYYLERVGLA DAMDKRAADL 
SNGMKQRVGI ARAFALSPKL LLLDEPFGML DSLTRWELQE VLMEVWSRTK VTAICVTHDV 
DEAILLADRV VMMTNGPQAT IGKITDVNLP RPRTRKALLE HPDYYSYRQD VLDFLEEYEH 
GAKPRPKAAA PKAVAAE