Gene Noca_0100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_0100
Symbol
ID	4600073
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	112886
End bp	114469
Gene Length	1584 bp
Protein Length	527 aa
Translation table	11
GC content	73%
IMG OID	639774710
Product	ABC transporter related
Protein accession	YP_921332
Protein GI	119714367
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1129] ABC-type sugar transport system, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.145472
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACCGATC CGGCCCGCCC GGTCCTCCGG ATGAGGGGCG TCGCCAAGAC GTTCGGCCTC 
ACCCGGGTGC TCCAGGACGT CGACCTCACC GTGCGCCGCG GTGAGGTCCA CGGCCTGCTC 
GGCCAGAACG GGTCGGGCAA GTCGACGCTG ATCAAGATCC TCGCCGGGTT CCACACCCCG 
GACGAGGGGT CGATCGAGCT CGACGGTGCG TCGGTCGACC TGCCGCTGTC CGCCGTGGAC 
CGGCGCAAGC ATCGGCTGCG GTTCGTCCAC CAGGACCTGG CGCTGCTGCC GTCGTTGACG 
GTGCTCGAGA ACCTGCTCGC CGACGACGTC GCCACGGGGC CGGGCATCCG GCCCCGGCGG 
CGGCGCGCCG AGCTCGCCCG CGCCACCGCG CAGTTCGACC GGTTCGGGAT CTCGCTGCGC 
CCGGACACGC TCGTGCGGGA CATCTCGCGC CTGGACCGGG CCAAGCTGGC GATCGCCCGC 
GCCGTCAGCC ACCTCGGTGA CGATGACGGT GACGTGGCCG GCGCGGGTCG GGGGCTGCTG 
GTGCTCGACG AGCCGACCGC CTTCCTGCCG CACAGCGAGG TCGCCGAGCT GATCGCGCTG 
ATGCGGGCGG TGGCCGCGCA GGGCACGGGC GTCCTGTTCG TGTCGCACGA CCTCGACGAG 
GTCCTGACGG TGACGGACCG CGTCAGCGTG CTGCGCGACG GCCAGCTGGT CGGCAGCGAG 
GACACCGCCT CGCTGGCGCG CGGGGATCTC GTGCGGTTGA TCGTGGGCCG GCCGGTCTCC 
GTGTTGAGCG CCGGCTCCGC GCCGGTCCCC GCGAGCCAGG AGCGGCCGCG GCTCCAGGTG 
AGCGCGCTGC GCGGTGGCGC GGTGCAGCAC CTGGACCTGA GCGTGCACCC GGGTGAGGTC 
GTCGGCGTCA CCGGCGTGAT CGGGTCCGGG TTCGACGAGG TGACCCAGCT GCTCTTCGGA 
GCGCTGCGGG CCAGCGGCGG GTCGGTCGCG ATCGACGACC TCGCGCTCGA GGCGCGCCGG 
CTCTCGCCGG CCACGGCGAT CAAGGCCGGC GTCGCCTACC TCCCCAGTGA CCGTGCGGTC 
CAGGGCAGTG CCCCGAGCCT GACCGTGGGG GAGAACGTCG CGCTGCTCTC GCTGCGCAAG 
GGTGGCGGTC CCTTCGCCCT GACCGGCCGG AGGCTCGAGC GGCACGCGGG CAAGCTGCTC 
CGCGACCTCG ACGTACGTCC GCCCGAGCCC ACGCTCGCCT ACGCCTCCCT CAGCGGCGGC 
AACCAGCAGA AGGCGATGAT GGCCAAGTGG CTGGTGACCG GCCCCAAGGT CCTGCTGCTC 
AGCGAGCCCA CCCAGGGTGT CGACGTCGGG GCGCGCGAGC AGATCTTCAC CCTCATCGCC 
GAGGCCGCCC GGCAGGGCTG CGCGGTCGTG TGCTCGAGCT CCGATCTCGA CCAGCTGGCC 
CAGATCTGCA ACCGCGTGCT GCTCATGCGG CGCGGTGTCA TCTCGGACGA GGTGCACGGT 
GAGGCCGTCA CCAAGGCCGG CCTGACCGAG ATGCTGTTCG CCGACGCGGT GGTCAGATCG 
CGCCGCGCCA CCTCCGACGC CTGA

Protein sequence

MTDPARPVLR MRGVAKTFGL TRVLQDVDLT VRRGEVHGLL GQNGSGKSTL IKILAGFHTP 
DEGSIELDGA SVDLPLSAVD RRKHRLRFVH QDLALLPSLT VLENLLADDV ATGPGIRPRR 
RRAELARATA QFDRFGISLR PDTLVRDISR LDRAKLAIAR AVSHLGDDDG DVAGAGRGLL 
VLDEPTAFLP HSEVAELIAL MRAVAAQGTG VLFVSHDLDE VLTVTDRVSV LRDGQLVGSE 
DTASLARGDL VRLIVGRPVS VLSAGSAPVP ASQERPRLQV SALRGGAVQH LDLSVHPGEV 
VGVTGVIGSG FDEVTQLLFG ALRASGGSVA IDDLALEARR LSPATAIKAG VAYLPSDRAV 
QGSAPSLTVG ENVALLSLRK GGGPFALTGR RLERHAGKLL RDLDVRPPEP TLAYASLSGG 
NQQKAMMAKW LVTGPKVLLL SEPTQGVDVG AREQIFTLIA EAARQGCAVV CSSSDLDQLA 
QICNRVLLMR RGVISDEVHG EAVTKAGLTE MLFADAVVRS RRATSDA