Gene Ndas_2332 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2332
Symbol
ID	9246182
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	2782216
End bp	2783466
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	77%
IMG OID
Product	type III effector Hrp-dependent outers
Protein accession	YP_003680260
Protein GI	297561286
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.411817
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGACCC TCGGCGTGAT CGCCGACGAC CTCACCGGAG CGACCGACGT CGCGATCGCC 
CTCACCGCGT CCGGCCACCG GACCACGGTG GTCCTGGACT CGCGGGACCC CGGCGGCGCC 
GACCCCGTCG CCGCCGCGGC GGAGGGGGCC GACGCCGTCG TCGTGGCCCT GAAGTCGCGC 
ACCACGCCCG CCGACGCGGC GGTCGCGGCC TCGCTGGACG CCCTCGACCG GCTGCGGAGC 
GCGGGGTGCG AGCGGTTCTA CCTCAAGTAC TGCTCCACCT TCGACTCCAC CCCGGACGGC 
AACATCGGCC CGGTCGCGGA GGCGGTGCTC GACGCCCTCG GCGAGGACGT CACGGTCGTC 
GCACCGGCCT TCCCCGCCAA CGGGCGCACC GTCTACCGCG GCCACCTCTT CGTGGGGGAC 
GACCCCCTCG ACGAGTCCCC GATGCGCCAC CACCCGCTCA CGCCCATGAC CGACTCCAGC 
CTCCCGCGCC TGCTCGCCCC CCAGGTCAGC GGCGGCGGGG ACGCCATCGC GCTGGTGCCC 
TGGCCGGTGG TCGCCCGGGG GGCCGAGGCG GTGCGCGACG CCATCGCGCG GGCCGGTGCG 
CAGGGGGCCC GGTTCGTGGT CGTGGACGCC CTGACCGACG CCGACCTGCG CACGCTCGCC 
GACGCGACGC GGGACCTGCG CCTGCTGACC GGCGGCAGCG CCCTCGCCCA GGGGCTCACC 
GGCCCCCACG GGACCGGCCG CCTGCCGCTC ACCCCGCCCC GGGGGCCGCG CGTCGTCCTC 
TCGGGCAGCG CCTCGCGGGC GACCCAGGGC CAGGTGCGCC ACGCCCTCGC CCACGGCGGG 
GGACACCACC TGCTCCCCTC CGACCTGCGC CGGGACTTCG GGGCGACGGT GTCGCTGGCC 
GTGGAGCGCG CCCTGGAGGG CGGCGCGTCC CCGTTCGTGG TGTACGCGAC CGCCGCACCC 
GAACACGTCG TGGACACCGC CGACGCGCCG CTCATCGAGG AGGCTCTGGC CGAGATCGCC 
GCACGCCTGG TCGCCGCGGG GGCGCGCGCG CTCCTGGTCG CGGGCGGCGA GACGAGCGGA 
GCCGTCGTGC GGCGCCTGGG CGTGGCGTCG CTGGCGCTGG GACCCGAGAT CGACCCGGGC 
GTCGCGTGGA CGCTCGGACA CAGCGACGGT GAGGACGTCC AGCTCATGCT CAAGTCCGGC 
AACTTCGGCC GCGAGGACCT GTTCGTCCGC GCCTGGGAGG GGGACAAGTG A

Protein sequence

MATLGVIADD LTGATDVAIA LTASGHRTTV VLDSRDPGGA DPVAAAAEGA DAVVVALKSR 
TTPADAAVAA SLDALDRLRS AGCERFYLKY CSTFDSTPDG NIGPVAEAVL DALGEDVTVV 
APAFPANGRT VYRGHLFVGD DPLDESPMRH HPLTPMTDSS LPRLLAPQVS GGGDAIALVP 
WPVVARGAEA VRDAIARAGA QGARFVVVDA LTDADLRTLA DATRDLRLLT GGSALAQGLT 
GPHGTGRLPL TPPRGPRVVL SGSASRATQG QVRHALAHGG GHHLLPSDLR RDFGATVSLA 
VERALEGGAS PFVVYATAAP EHVVDTADAP LIEEALAEIA ARLVAAGARA LLVAGGETSG 
AVVRRLGVAS LALGPEIDPG VAWTLGHSDG EDVQLMLKSG NFGREDLFVR AWEGDK