Gene Noca_3415 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_3415
Symbol
ID	4598213
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	3616735
End bp	3617859
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	69%
IMG OID	639778021
Product	biotin synthase
Protein accession	YP_924602
Protein GI	119717637
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0502] Biotin synthase and related enzymes
TIGRFAM ID	[TIGR00433] biotin synthetase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.371377
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGACAT CCTTCGATCA CCTGGCGGAC CGCATCCTTG CCGGAGGTGA CGCGACGCCC 
GCCGACGCGT TGGCGGTGCT ACGCGCCGAC GAGAAGGACC TGCTCCACGT GGTTGCGGCA 
GCGGGTCGGC TGCGCCGCGC GCGCTTCGGC AACACGGTGA AGGTCAACTA CCTGGTGAAC 
CTGAAGTCCG GGCTCTGTCC GGAGGACTGC CATTACTGCA GCCAGGCGCT GGGATCCCGG 
GCGCCGATCC TCAAGTACAA CTGGCTCTCG TCCGAGGAGG TCCTGGAGCA GGCCGGTGCC 
GGCCTGCGAG GCGGGGCGAC GCGGGTGTGC CTGGTGTCCT CGGGCCGTGG CCCGTCGGAC 
CGGGACGTGG ACCGGGTCGC AGCGATGGCC CAGGAACTGA AGGGTGAGCA GCCCGGCGTC 
GAGATCTGCG CCTGTCTAGG GTTGCTGAAG GACGGGCAGG CCGAGCGGCT CCGGGCAGCC 
GGAGTGGACG CCTACAACCA CAACATCAAC ACCGCCGAAT CCCACCACGA CACCATTGTC 
TCGACCCACT CCTACTCCGA TCGAGTGGAC ACCATCGAGA AGGCGGCGGC CGCTGGGCTC 
TCGCCGTGCT CGGGATTGAT CGCCGGACTC GGCGAGACCG ACGAGCAGCT GGTCGAGGCG 
CTGTTCGCGC TCAAGGCTCT GGGCGCGGAC TCGATCCCGG TGAACTTCCT GATGCCGTTC 
GACGGCACCC CCAGCGAGCG CACTTTCGAG CTCACGCCGA TCCGGTGCGT GCAGATCCTG 
GCGATGACAC GATTCGTGTG TCCCGATACC GAGATCCGCA TCGCCGGCGG CCGCGAGATG 
CACCTGCGGT CGCTGCAGGC CCTCGCCCTG CATGTCGCGA ACTCCATCTT CCTCGGCGAC 
TACCTCACTT CCGAGGGCCA GGACGCGCGC GCCGACCTGG AGATGCTGCG CGACAACGGG 
TTCGCCATCC TCGGCGCGGA GGCCAAACCC GCCGGCACGG CCACTGCGGC CCACCGCGCC 
CAGACAGCCC ACGACATTGC CGGCGGCACC TCCGTTGCGG GGTCCGCCCC GGATCCGGCG 
ATCCGCCGCC GTGGCGCCGG AACCGACGTG CCGGCCAACG CGTGA

Protein sequence

MQTSFDHLAD RILAGGDATP ADALAVLRAD EKDLLHVVAA AGRLRRARFG NTVKVNYLVN 
LKSGLCPEDC HYCSQALGSR APILKYNWLS SEEVLEQAGA GLRGGATRVC LVSSGRGPSD 
RDVDRVAAMA QELKGEQPGV EICACLGLLK DGQAERLRAA GVDAYNHNIN TAESHHDTIV 
STHSYSDRVD TIEKAAAAGL SPCSGLIAGL GETDEQLVEA LFALKALGAD SIPVNFLMPF 
DGTPSERTFE LTPIRCVQIL AMTRFVCPDT EIRIAGGREM HLRSLQALAL HVANSIFLGD 
YLTSEGQDAR ADLEMLRDNG FAILGAEAKP AGTATAAHRA QTAHDIAGGT SVAGSAPDPA 
IRRRGAGTDV PANA