Gene Ndas_3391 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3391
Symbol
ID	9247256
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	4053094
End bp	4054446
Gene Length	1353 bp
Protein Length	450 aa
Translation table	11
GC content	71%
IMG OID
Product	FolC bifunctional protein
Protein accession	YP_003681302
Protein GI	297562328
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCGAAG CCAGCGCCGA GCGGCGCTAC GCCGAGGTGA CCGCGGAGAT CCTCGCCCGC 
GCGCCCGAGT CCGACATCGA TCCTCGACTG GACCGGGTCC GCACCCTGCT GGACCTCCTG 
GGCGACCCGC ACCGCAACTT CCGGGCCATC CACGTCACCG GTACCAACGG CAAGACCTCC 
ACCGCCCGCA TGATCGACGC GCTCATGCGC GGGCGGGGTC TGCGCGTGGG CCGCTACACC 
AGCCCGCACC TGCGCACCGT GCGCGAGCGC ATCGTCATCG ACGGGGAGCC CATATCCCAG 
GAGCGGTTCG TCGCGGCCTA CGACGACATC CGCCCCTACG TCGAGATGGC CGACTCGATG 
AACGACGCAC CGCTGTCGTT CTTCGAGATC CTCACGGTGA TGGCCTACGC CGTCTTCGCC 
GACGCCCCCG TGGACGTGGC CGTCGTCGAG GTCGGCATGG GCGGCCGGTG GGACGCCACC 
AACGTCATCG ACGGAGACGT CGCCGTGGTG ACCCCCATCG GGATCGACCA CACCGAGTAC 
CTGCCCGACA CGGTGGAGGG CATCGCCGAG GAGAAGGCGG GCATCATCAA GCCCGACTCC 
GTGGCGGTCC TGGCCCAGCA GCCGCTGCCC GCCGCCGAGG CCCTGGTCCG CAACGCCGCG 
GAGGTCGGGG CGCGGGTGGC CAGGGAGGGC CTGGAGTTCG GCGTCACCTC CCGCGAGATC 
GCCGTCGGCG GCCAGCAGAT CGCCGTCAAG GGCCTCACCG GCAACTACGA GAACCTGTTC 
CTGCCCCTGT TCGGGGCACA CCAGGCGGGG AACGCCGCCG TGGCCCTGGC CGCGGTCGAG 
GCGTTCGCCT CCTCCGGCGA CGACGCCGGG GGCCTGGACC CCGCGATCGT CGCCGAGGCC 
CTCGCGGGAG TGGACTCCCC GGGCCGTATG GAGGTCGTGC GCACCAGCCC GACCATCATC 
GCCGACGCGG CGCACAACCC GGCCGGGATG ACCGCCACCG CGGCGGCCGT GGAGGAGGCC 
TTCACCTTCT CCCGGCTGGT CGGGGTGGTC GCGATCATGG CCGACAAGGA CGTCGAGGGG 
ATCCTCGAAC CCCTCGAACC ACTGCTCGAC GAGATCGTCG TCACCCGTAA CTCCTCCCCG 
CGTTCCCTCG AACCGGAGCG GCTGTCCAAC GTCGCCCAGC ACATCTTCGG TGAGGAACGC 
GTGCACGTGG AGCCCCGACT CGACGACGCC ATCGACCGGG CCGTGGGCCT GGCCGAGGAA 
GGCGGGGAGT TCGGCGGCAC CGGTGTACTG GTCACCGGAT CGGTCGTCAC CGCCGGTGAC 
GCCGTCCACC TGTTGCGCGG TGCGCAGGAG TGA

Protein sequence

MSEASAERRY AEVTAEILAR APESDIDPRL DRVRTLLDLL GDPHRNFRAI HVTGTNGKTS 
TARMIDALMR GRGLRVGRYT SPHLRTVRER IVIDGEPISQ ERFVAAYDDI RPYVEMADSM 
NDAPLSFFEI LTVMAYAVFA DAPVDVAVVE VGMGGRWDAT NVIDGDVAVV TPIGIDHTEY 
LPDTVEGIAE EKAGIIKPDS VAVLAQQPLP AAEALVRNAA EVGARVAREG LEFGVTSREI 
AVGGQQIAVK GLTGNYENLF LPLFGAHQAG NAAVALAAVE AFASSGDDAG GLDPAIVAEA 
LAGVDSPGRM EVVRTSPTII ADAAHNPAGM TATAAAVEEA FTFSRLVGVV AIMADKDVEG 
ILEPLEPLLD EIVVTRNSSP RSLEPERLSN VAQHIFGEER VHVEPRLDDA IDRAVGLAEE 
GGEFGGTGVL VTGSVVTAGD AVHLLRGAQE