Gene Gdia_2244 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_2244
Symbol
ID	6975673
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	2489238
End bp	2490239
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	67%
IMG OID	643391771
Product	protein of unknown function DUF403
Protein accession	YP_002276614
Protein GI	209544385
COG category	[S] Function unknown
COG ID	[COG2307] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCAACC TGCTGTCGCG CTATGCCGAA TGCACGATCT GGCTGGCGCG GTACATGGAG 
CGGATCGAGA ACCTGGCCCG GCTGATCGAC GTGACCGAGA CGTTCGTGCG CACGCGCAGC 
ACCGCCACCG GCTGGCTGTC GATCGTGCAG ATCAACGCGG ACGAGGAGCG GTTCTTCGCA 
CGGCACGACA CGGCGTCCGA GCAGAATGTC GTCGATTTCT ACGTCACCGA CCGCGAGAAT 
CCGAACTCCA TCGCCTCGAT CGCCCATGCG GCGCGCGAGA ACGCCCGCGC GCTGCGCCCG 
CTGATTTCGA CCGAGATGTG GACGCAGCTC AACATCTTCA CCAATTCGAT CCGCGCGCTG 
GGGCCCAGCG ATATCCGGTC GTCGAACCTG TCCGGCCTGT GCGCCCGGCT GAAGCAGGAT 
TGCCAGACCC ATCACGGCAT TACCGAGGGC ACGTTCTATC GCGACCAGGC GTGGCTGTTC 
TACCTGATGG GCCGCACGCT GGAACGCGGC GACCAGATCA CCCGGCTGAT CGACATCAAA 
TACCACACGC TGCTGCCCAG CGGGACCGGC GTGGGGTCGG AGGTCGATAT CGGCCAATGG 
TCCGCCGTGC TGCGTGCCGC CGCCGCCTAT CACGCCTTCC GCCGCACCGC GTCGGGCGAG 
ATCACGCCCG GCCGCGTCGT GGGCTTCCTG CTGAAGAATG ACGGCTTCCC GCGCGCGCTG 
TCGACCAGCC TGCGCCAGTT GCACTGGGCG GTGGGGCATC TGCGCACCGA TTACGGGCTG 
AAGAACGGCT ACGCCGCCGC CGAGCGGATC GAGGAACTGC GCGCGACCCT GGCCGAACAG 
ACGGTGCAGG ACATCATCCT GCGCGGCCTG CACGAATTCC TGGACTGGGT GCAGCGCGAA 
CTGCGCCTGG TGCAGGGCGA GATCGCCCAG GCCTTCTGGC CGCCCACGAT GCCCGAAGCC 
CCGCCCGACC AAGGCCAGAA CCAGACCCAA AGCCAGTCCT GA

Protein sequence

MPNLLSRYAE CTIWLARYME RIENLARLID VTETFVRTRS TATGWLSIVQ INADEERFFA 
RHDTASEQNV VDFYVTDREN PNSIASIAHA ARENARALRP LISTEMWTQL NIFTNSIRAL 
GPSDIRSSNL SGLCARLKQD CQTHHGITEG TFYRDQAWLF YLMGRTLERG DQITRLIDIK 
YHTLLPSGTG VGSEVDIGQW SAVLRAAAAY HAFRRTASGE ITPGRVVGFL LKNDGFPRAL 
STSLRQLHWA VGHLRTDYGL KNGYAAAERI EELRATLAEQ TVQDIILRGL HEFLDWVQRE 
LRLVQGEIAQ AFWPPTMPEA PPDQGQNQTQ SQS