Gene Jann_3040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Jann_3040
Symbol
ID	3935511
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Jannaschia sp. CCS1
Kingdom	Bacteria
Replicon accession	NC_007802
Strand	+
Start bp	3066280
End bp	3067638
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	62%
IMG OID	637905411
Product	putative nitrate transport protein
Protein accession	YP_510982
Protein GI	89055531
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0757013
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.570459
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCGGA TTATCGCAGC CCTCTTTACC ACCACAGCGC TCGCAGGCCC GCTTGCAGCA 
CAAGACCTCG AAATCGACGA GCTGACCTTC GGCTTCATCA AACTCACCGA TATGGCGCCG 
CTCGCGATTG CCTATGAGAT GGGCTTTTTC GAGGACGAAG GCCTCTTCGT TACGCTTGAG 
GCGCAAGCCA ATTGGCGGGT CCTTTTGGAC GGGGTGATCG ACGGTACGCT GGACGGCGCG 
CACATGCTCG CGGGTCAACC GATTGCGGCT ACAATCGGCT ACGGCACGCA GGCCAATATC 
ATCACCCCAT TCTCCATGGA CCTCAACGGC AACGGCATCA CGGTCTCCAA CGAGGTCTGG 
GATTTGATGC GCCCGCACAT CCCCTCTATG GACGATGGCC GCCCGGTTCA TCCAATCAGC 
GCCTCGGCCC TCGCGCCCGT CGTCGAGCAA TACCGCCAAG AGGGCACGCG CTTTGACATG 
GGCATGGTCT TCCCCGTCTC CACCCATAAT TACGAGATCC GCTTTTGGCT GGCCGCCGGT 
GGCCTGCACC CAGGTTTTTA TAGCCCTGAC GACATCACCG GCACGATTGA CGCGGATGTT 
TTCCTGTCTG TCACGCCCCC TCCGCAGATG CCTGCGACGC TGGAAGCGGG GACTATTTTT 
GGCTACGCGG TGGGGGAGCC CTGGAACCAG CAGGCCGTCC AACGGGGCAT CGGTGTGCCG 
GTGATCACCG ATTATCAATT GTGGCCCAAC AACCCCGAAA AGGTCTTTGG GATTACCGAA 
GACTTCGCCG AACAGAACCC CAACACCACG CAGGCCATCG TCCGCGCGCT GATCCGGGCC 
GGCATGTGGC TGGACGAGAA TGACAACGCC AACCGTGCGG AAGCCGTGTC GATCCTGTCC 
TACCCGGAAT ACGTGGGCGC AGACGAAGAC GTCATCGCGG CGTCCATGAC TGGTACGTTC 
GAATTCGAGC CCGGCGACGT GCGCGACATC CCCGATTTCA ACGTCTTCTT CCGCTACTAC 
GCGACCTATC CCTACTATTC GGATGCGGTC TGGTACCTGA CGCAAATGCG CCGCTGGGGC 
CAAATCCCCG AGGCCATGTC CGATGAGTGG TACCACGAGG TTGCGGCGCA AGTGTACCGC 
CCCGACATCT ATCTGGAGGC CGCGCGCAGC CTGGTCGATG ACGGCTTGGC GGCGGAGGCC 
GACTTCCCCT GGGACACCGA CGGCTTCCGT GACGTTGAGA CCGAGATGAT GGGCGGCGTG 
CCCTACGACG GGCGCACGCC CAACGCCTAT ATCGACGCGC TGGAGATCGG TCTGACCGGC 
GACGAAGTGG TCGTTGACGG GGCCGTCACG GGCGGCTGA

Protein sequence

MNRIIAALFT TTALAGPLAA QDLEIDELTF GFIKLTDMAP LAIAYEMGFF EDEGLFVTLE 
AQANWRVLLD GVIDGTLDGA HMLAGQPIAA TIGYGTQANI ITPFSMDLNG NGITVSNEVW 
DLMRPHIPSM DDGRPVHPIS ASALAPVVEQ YRQEGTRFDM GMVFPVSTHN YEIRFWLAAG 
GLHPGFYSPD DITGTIDADV FLSVTPPPQM PATLEAGTIF GYAVGEPWNQ QAVQRGIGVP 
VITDYQLWPN NPEKVFGITE DFAEQNPNTT QAIVRALIRA GMWLDENDNA NRAEAVSILS 
YPEYVGADED VIAASMTGTF EFEPGDVRDI PDFNVFFRYY ATYPYYSDAV WYLTQMRRWG 
QIPEAMSDEW YHEVAAQVYR PDIYLEAARS LVDDGLAAEA DFPWDTDGFR DVETEMMGGV 
PYDGRTPNAY IDALEIGLTG DEVVVDGAVT GG