Gene Noca_3680 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_3680
Symbol
ID	4595792
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	3902770
End bp	3903864
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	65%
IMG OID	639778288
Product	ABC transporter related
Protein accession	YP_924867
Protein GI	119717902
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3839] ABC-type sugar transport systems, ATPase components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGCTG TCGAGTTGCG TCACGTCTCC AAGATCTTCG GTTCCAAGAC GACTGTCGAT 
GACATCAGTC TCACCCTGCC CGACGGACAG CTCACCGTGT TGGTCGGGCC ATCCGGGTGC 
GGAAAGACGA CCACGCTCCG CATGATCGCT GGCTTGGAAG CCGTTTCCCA CGGCTCGATC 
CACTTCGACG GAGAGGACGT CACCGGTGGA GAACCGCGGA CTCGCGATGT GTCGATGGTG 
TTCCAGAACT ACGCCCTCTA CCCCCATCTG ACGGTTCAGG ACAATCTTGC CTTTCCGGTT 
CTTGCTCGCG GCGGCAAGCG CGCCGATGCC ATTCGACGAG CACGTGAGGC GGCTGAGATG 
CTCGGGCTCA CCGAACTGCT GCAGCGCAAG CCTGGGCAAC TCTCGGGGGG ACAGCAGCAG 
CGGGTGGCAA TCGGACGTGC CGTCGTGCGA GAACCGCGGG TGTTCCTGTT CGACGAGCCG 
CTGTCCAACC TGGATGCGCG GTTGCGGGTG GAGATGCGCT CGGAGATCCT CCGGCTGCAG 
CGTCAGCTTG GTGTCACGGC CGTCTATGTC ACCCACGACC AGGAGGAGGC GATGACCATG 
TCCGACAGCA TGGTCGTCAT GGACGGCGGC ACCATCGCTC AGCAGGGCAG CCCGCGGGAG 
GTCTACGCCG CTCCAGCCAC CACTTTCGTC GCCGGATTCG TCGGATCGCC CCGCATGAAC 
CTGATCGCCG GTCGGGTCGT CGGTGGGGTC TTCGAGTCTC GGTGGGGTCG AGTGCCGATG 
GGTGCCGCCG ACCAGGAAGG CAGCTTGGGT GTACGCCCCG AGCTCGTTCG TCTGGTCGGG 
GCTGACCACA ACGAGTCGAG CCGGGCAAGG AATGATCCTG GCGCCGGTGC GGGCGCTGCG 
GCCCGAGTCG AGCTGGTCGA GCTTCTAGGT CCGCGAGCCA TCGTCTCGCT CAACGCCGAT 
GGCGAGCGGC TCATTGCAGT CGTGGAGGCT CGCGACCTGT CGGGCATCCA TGAGGGCAGC 
CTGGTCGACG TGGACTTCGC GTCTGCGGGC CTGCACTTCT TCGAAGCCGG CGGACAGCGG 
CTGTTGACGA CGTGA

Protein sequence

MAAVELRHVS KIFGSKTTVD DISLTLPDGQ LTVLVGPSGC GKTTTLRMIA GLEAVSHGSI 
HFDGEDVTGG EPRTRDVSMV FQNYALYPHL TVQDNLAFPV LARGGKRADA IRRAREAAEM 
LGLTELLQRK PGQLSGGQQQ RVAIGRAVVR EPRVFLFDEP LSNLDARLRV EMRSEILRLQ 
RQLGVTAVYV THDQEEAMTM SDSMVVMDGG TIAQQGSPRE VYAAPATTFV AGFVGSPRMN 
LIAGRVVGGV FESRWGRVPM GAADQEGSLG VRPELVRLVG ADHNESSRAR NDPGAGAGAA 
ARVELVELLG PRAIVSLNAD GERLIAVVEA RDLSGIHEGS LVDVDFASAG LHFFEAGGQR 
LLTT