Gene Ndas_2963 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2963
Symbol
ID	9246816
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	3538426
End bp	3539838
Gene Length	1413 bp
Protein Length	470 aa
Translation table	11
GC content	65%
IMG OID
Product	FeS assembly protein SufB
Protein accession	YP_003680879
Protein GI	297561905
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGTCTA TCGCGCATCC CGAGCTCGAG GGGATCGGAA CATACGAGTA CGGCTGGGCC 
GACTCCGACG CGGCCGGGGC CTCGGCCCGC CGCGGTCTCA ACGAAGAGGT CGTCCGCGAC 
ATCTCCGCCA AGAAGGACGA GCCGGAGTGG ATGACCAAGC TCCGCCTCAA GTCCCTACGG 
CTCTTCGACA AGAAGCCCAT GCCCAACTGG GGCGCGGACC TGTCCAAGAT CGACTTCGAC 
AACATCAAGT ACTTCGTGCG GTCCACGGAG AAGCAGGCCA CCTCCTGGGA GGACCTGCCC 
GAGGACATCA AGAACACCTA CGACAGGCTG GGCATCCCCG AGGCGGAGAA GCAGCGCCTG 
GTCGCCGGTG TCGCCGCGCA GTACGAGTCC GAGGTCGTCT ACCACCAGAT CCGCGAGGAC 
CTGGAGGAGC AGGGTGTCAT CTTCCTGGAC ACCGACACCG CCCTCAAGGA GCACCCGGAG 
ATCTTCGAGG AGTACTTCGG CTCCGTGATC CCGGCCGGCG ACAACAAGTT CGCCGCGCTC 
AACACCGCCG TGTGGAGCGG CGGGTCGTTC ATCTACGTGC CCAAGAACGT GCACGTGGAG 
ATCCCGCTCC AGGCCTACTT CCGGATCAAC ACCGAGAACA TGGGCCAGTT CGAGCGGACC 
CTGATCATCG TCGACGAGGG CGCCTACGTC CACTACGTCG AGGGCTGCAC CGCGCCGATC 
TACAAGTCGG ACTCGCTGCA CTCCGCGGTC GTGGAGATCA TCGTCAAGAA GAACGCCCGC 
TGCCGTTACA CGACCATCCA GAACTGGTCC AACAACGTCT TCAACCTGGT CACCAAGCGC 
GCCGTGGCCG AAGAGGGCGC GACCATGGAG TGGATCGACG GCAACATCGG CTCCCAGGTC 
ACCATGAAGT ACCCGGCCGT CTACCTGATG GGCGAGCACG CCAAGGGCGA GACCCTGTCC 
ATCGCCTTCG CGGGCGAGGG CCAGCACCAG GACACCGGGT CCAAGATGGT GCACTGCGCG 
CCCAACACCT CCTCCACCAT CATCTCCAAG TCGGTGGCAC GCGGCGGGGG CCGCGCCTCC 
TACCGGGGAC TGGTGCAGGT GCAGGAGGGC GCCGACCACG CCAAGTCCTC GGTCAAGTGC 
GACGCGCTGC TGATCGACAC CATCAGCCGT TCGGACACCT ACCCCTACAA CGACCTGCGC 
GAGGACGACG CCGAGCTCGC GCACGAGGCG ACCGTCTCCA AGGTCAGTGA GGACCAGCTC 
TTCTACCTGA TGAGCCGGGG CATGGACGAG GACGAGGCCA TGGCCATGAT CGTGCGCGGG 
TTCGTCGAGC CCATCGCGCG CGAGCTGCCC ATGGAGTACG CGCTGGAACT GAACCGGCTG 
ATCGAGCTTC AGATGGAAGG AGCGGTTGGT TAA

Protein sequence

MTSIAHPELE GIGTYEYGWA DSDAAGASAR RGLNEEVVRD ISAKKDEPEW MTKLRLKSLR 
LFDKKPMPNW GADLSKIDFD NIKYFVRSTE KQATSWEDLP EDIKNTYDRL GIPEAEKQRL 
VAGVAAQYES EVVYHQIRED LEEQGVIFLD TDTALKEHPE IFEEYFGSVI PAGDNKFAAL 
NTAVWSGGSF IYVPKNVHVE IPLQAYFRIN TENMGQFERT LIIVDEGAYV HYVEGCTAPI 
YKSDSLHSAV VEIIVKKNAR CRYTTIQNWS NNVFNLVTKR AVAEEGATME WIDGNIGSQV 
TMKYPAVYLM GEHAKGETLS IAFAGEGQHQ DTGSKMVHCA PNTSSTIISK SVARGGGRAS 
YRGLVQVQEG ADHAKSSVKC DALLIDTISR SDTYPYNDLR EDDAELAHEA TVSKVSEDQL 
FYLMSRGMDE DEAMAMIVRG FVEPIARELP MEYALELNRL IELQMEGAVG