Gene Ndas_2103 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2103
Symbol
ID	9245953
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	2522791
End bp	2523852
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	72%
IMG OID
Product	biotin synthase
Protein accession	YP_003680034
Protein GI	297561060
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.881041
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCACAT TCCTTCCCCT GGCCGAGAAG GCCCTTCGCC GCGAGACGCC CACCCGCGCC 
GAACTCCTCG GAGTTCTGAG CAGCTCCGAC GACGACCTGA TGGACCTGGT CGCCGCGGCC 
TTCCGCGTCC GACGGCGTTA CTTCGAGCGC CGCGTCAAGC TCAACTACCT CGTGAACGTC 
AAGAGCGGAC TGTGCCCGGA GGACTGCTCC TACTGCTCCC AGCGCCTGGG CTCCGACGCC 
GGAATCGTCA GGTACACCTG GCTCAGGCCC GACCAGACCC GCGAGGCCGC CTCCCACGGG 
GTGAGGGCGG GCGCCACCCG GGTCTGCCTG GTGGCCAGCG GGCGCGGCCC CACCGACCGC 
GACGTGGAAC GGCTGGCCCC CGCCATCGAG GGCATCAAGA GCGAGCACCC CGGCGTGGAG 
GTGTGCGCCT GCCTGGGTCT GCTCTCCGAG GGCCAGGCCG ACCGGCTGCG CCGGGCCGGG 
GCCGACGCCT ACAACCACAA CCTCAACACC TCGGAGGAGC GCTACGCCGA CATCTGCACC 
ACCCACGCGT TCGCCGACCG GGTGGACACC GTGACCCGGG CGAAGCAAGC GGGCCTGTCC 
CCCTGCTCCG GGCTGATCGC CGGGATGCGG GAGAGCGACG ACGACCTGGT CGACGCCCTG 
TTCGCGCTGC GCGAACTGGA ACCGGACTCG GTGCCGGTCA ACTTCCTCAT GCCCTTCGAG 
GGCACCCCGC TGGAGGGCAC CTGGGAGCTG ACCCCGCAGC GGTGCCTGCG CGTCCTGGCC 
GCCGCCCGGT TCGTCTTCCC CGACGTGGAG GTGCGCCTGG CGGGCGGCCG CGAGATCCAC 
CTGCGCTCCC TCCAGCCGCT GGCGCTGCAC ATCGCCAACT CGGTGTTCCT GGGCGACTAC 
CTCACCAGCG AGGGACAGGC GGGCCGGGCC GACCTGGAGA TGATCGAGGA CGCCGGTTTC 
ACCGTGCAGG GCGCGGGCGA GCCCACCCTG CCCAGGGAGC GCCACGACCT GCTCAGGCCG 
CGCCGGAGGG GCGCCGGAAC CGCTCTTCCG CCCAACGCCT GA

Protein sequence

MTTFLPLAEK ALRRETPTRA ELLGVLSSSD DDLMDLVAAA FRVRRRYFER RVKLNYLVNV 
KSGLCPEDCS YCSQRLGSDA GIVRYTWLRP DQTREAASHG VRAGATRVCL VASGRGPTDR 
DVERLAPAIE GIKSEHPGVE VCACLGLLSE GQADRLRRAG ADAYNHNLNT SEERYADICT 
THAFADRVDT VTRAKQAGLS PCSGLIAGMR ESDDDLVDAL FALRELEPDS VPVNFLMPFE 
GTPLEGTWEL TPQRCLRVLA AARFVFPDVE VRLAGGREIH LRSLQPLALH IANSVFLGDY 
LTSEGQAGRA DLEMIEDAGF TVQGAGEPTL PRERHDLLRP RRRGAGTALP PNA