Gene Noca_2936 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_2936
Symbol
ID	4597437
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	3117134
End bp	3118660
Gene Length	1527 bp
Protein Length	508 aa
Translation table	11
GC content	74%
IMG OID	639777541
Product	sulphate transporter
Protein accession	YP_924125
Protein GI	119717160
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0659] Sulfate permease and related transporters (MFS superfamily)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.304308
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCCCAC GGATCGTGCC ATCGGCGCGG GGTGACGTCG TCGCCGGTGT GACCGTCGCG 
CTGGTGCTGG TCCCGCAGGC GCTCGCCTAT GCGACGATCG CCGGACTCGA TCCCGTCTAC 
GGCCTGTACG CCGCCGTGGC CGCGCCCATC GCCGGGGCGC TGGTCGGGTC CTCCCCGTAC 
CTGCAGACCG GCCCGGTCGC GGTGACCAGC CTGCTGACGT TCGGCGCACT GGAGCCCCTC 
GCGCGACCGG AGACGCTGCG CTTCGCCGCG CTCGCGGCCG TGCTCGCCGT CCTGGTCGGC 
ATGGTGCGGG TCCTGCTCGG CCTCCTCGGC GGCGGCCCGA TCGCCTACCT GATGTCCCAG 
CCCGTCGTGG TCAGCTTCAC GACCGCGGCG GCGCTCCTGA TCATCGGGAC CCAGGTGCCG 
GCCCTCCTCG GGATGCAGGG CGACTCGGCC AACCCCTTGG TGGGCGCCGT CCGGGCGCTG 
GCCGACCCCG CAGCGTGGAG CTGGACCGAC CTGGTCGTCG GACTGGTCGC GATGACGCTG 
ATGCTCGGCA GCCGGCGCGT CTGGTCGCTG TTCCCCGGCG CCCTGCTGGC CGTCGTCCTC 
GCCGTGGTCT GGAGCCGGGC GACGGGCTAC GACGGGCGCA CGGTCGGCGC GGTGGACCTC 
TCGTACAGCA CTCCCCAGGG CGTGTCGGCC ACCGATCTCG CGACCCTCCT GGTGCCCGCC 
CTCGTCATCG CGATCGTCGG CTTCGCCGAG CCGGCCTCCA TCGCTCGTCG CTACGCCGCC 
GCGGACCGGC AGCCGTGGAA CCCGAACCTT GAGTTCGTCG GGCAGGGGCT GGCCAACCTC 
GCGTCCGGCG CGGCCGGCGG GTTCCCCGTC GGCGGCTCGT TCTCGCGCAC CAGCCTGAAC 
CGGCTCAGCG GGGCTCGGAC CCGGTGGAGC GGCGGCATCA CCGGGCTGGT GGTCCTGGCC 
ATCCTCCCGT TCGTGTCCGT GCTGTCCGCG CTGCCGCTCG CCGTCCTGGC CGGCCTGGTG 
ATCGGGGCGG TCGCCTCCCT GGTCGACGTG CGGACGCCGC TGCTCTACTG GCGCTGGTCG 
AAGCCGCAGT TCTCCGTGGG GGTGCTCACC GCGGTCGCCA CGATGGCCCT GGCGCCCCGG 
GTCGAGCGGG GTGTCCTGGT CGGTGTCGCG GCCGCGCTGG CGGTGCACCT GTGGCGCGAG 
ATGGGGGTGC ACCTGCCCGC CTTCGTGGAG GACGCGACCC TGCACCTGCG GCCGACCGGC 
GTGCTCTACT TCGGCTCGGC TCCGGCTCTC GAGAGGAGCA TCTCGAGGCT GATCGCGGAG 
CACCCCTCCG TCGACCGGGT GGTGCTGCAC CTGGACCGGA TCGGCCGGCT CGACCTCACC 
GGCGCGCTGA TGCTGCGCGA CATCCTCGCC GACGCGGAGA GCGCCGGGCG CACGTTCGAG 
ATCCGGGGTG CTCGCGCACA CGCCGCGGGA CTGCTGGTGC GGTTGCTGGG GCCGGAAGCA 
CGCATCTGCG GTGACGACGT GGCCTGA

Protein sequence

MRPRIVPSAR GDVVAGVTVA LVLVPQALAY ATIAGLDPVY GLYAAVAAPI AGALVGSSPY 
LQTGPVAVTS LLTFGALEPL ARPETLRFAA LAAVLAVLVG MVRVLLGLLG GGPIAYLMSQ 
PVVVSFTTAA ALLIIGTQVP ALLGMQGDSA NPLVGAVRAL ADPAAWSWTD LVVGLVAMTL 
MLGSRRVWSL FPGALLAVVL AVVWSRATGY DGRTVGAVDL SYSTPQGVSA TDLATLLVPA 
LVIAIVGFAE PASIARRYAA ADRQPWNPNL EFVGQGLANL ASGAAGGFPV GGSFSRTSLN 
RLSGARTRWS GGITGLVVLA ILPFVSVLSA LPLAVLAGLV IGAVASLVDV RTPLLYWRWS 
KPQFSVGVLT AVATMALAPR VERGVLVGVA AALAVHLWRE MGVHLPAFVE DATLHLRPTG 
VLYFGSAPAL ERSISRLIAE HPSVDRVVLH LDRIGRLDLT GALMLRDILA DAESAGRTFE 
IRGARAHAAG LLVRLLGPEA RICGDDVA