Gene Gdia_0563 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_0563
Symbol
ID	6973960
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	626865
End bp	628619
Gene Length	1755 bp
Protein Length	584 aa
Translation table	11
GC content	42%
IMG OID	643390095
Product	Terminase
Protein accession	YP_002274971
Protein GI	209542742
COG category	[R] General function prediction only
COG ID	[COG4626] Phage terminase-like protein, large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.126065
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00000000000223198
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAATATG AGGAAATCTA TAATAATTTA GATCCACTAT CAAAACAGCA ATACTCTTAT 
CCATATAAGG TTCTAAATGG AACTCTTGGT ACAGAGGTAT GTGAACTCAC CAGACTCGCA 
TGTGAAAGAT CATTCAGGGA TTTTGAACTT CCTGATTTCT ATTATGATCC AACCGATCCA 
GAACGGTTCC GTTTTCTGAC GACAAAGCTG GTCTATCTTG CTGGTGTAGG AAGTGTCGGC 
GGTACGCATG TACAAATCGA AGACTGGCAG TTGTGGTATT TCTCGCAACT TCTTGGATGG 
AAAAATGCGA ATGGCAGAAA CAAGGGAAAA CGTAGATTCA GAAAAGGATC ATTGTGGGTT 
GCTCGAGGAA ATAACAAAAC CGGTGCCGGA GCTTGGTTCT GCCTTTATAT GTTGCTCTGC 
GATGGAGAAT GGGACCCGCA GGTATATTCA GTCGGGGTAG ATCGCGATCA GGCGTCTCAT 
ACATTCAAAG CTGCAGCAAA TCAGATCGAG ACGAACCCAA AGTTATTCAA GGCATTGGGG 
GCACAAGTCT ATTCCAAATT CATAAAGGGA ATACAAAACT ACAAAGGCGA AAATAAACTC 
GGTGTTTTCA AAGCACTTGC TCGAGGTGCT TCAAAGATGA ATGGACTGAA TATCCATTTC 
GCTTTCCTTG ACGAGCTACA CGCTTATCCC GATCGATTAA CCTATGATGT CATCGTGTCA 
GGTGCCAAAA AGCGAGATCA GTCTCTGGTT CTGGCCGCAT CAACTGCCGG TCTGAATCTC 
GATAGTTTCG GATATGAAGA TTATTGTTAT GCCCGGTCAG TTCTACGTCA GGAGTTTGAT 
CAGCAGGATG AGCAGTTCTT CTCCTGTGTA TGGGAAGCTG ATGAAGGAGA TGATCCTTAC 
TCCGAGGCGA CCTGGGAGAA AGCCAATCCA TGCTGGAATT CTGCCATTGA TCAATTGTCC 
TTCAGAGCAG AGGCAGCTTC AGCCAAGAGG ATTCCATCCA AGCGAAGAGA ATTCTTCACC 
AAAAACCTGA ACCAATGGCT CTCGTCCGGA ACCACCTGGC TAGATATGGA TGCGGTCAAG 
GCGTGCTATG ATCCAGACAT AGAGGAAGAT GATGATTATG ATTTCGGAAT TACCGGGATA 
GATCTTGGCT CAAGATCGGA TCTTTGTGTT TATACAAACG TATTCGTAAA CACAATCGAT 
GAGCAACTAC ATTATTATGT TTTTCCTCAT CCTTATACAT CAGAAGGATT CTTGGAGAAG 
AATATTAGTT CTCAGTTTCG GGCATGGCAG AACGATGGAT GGCTTACTGT CCATAAAGGA 
AATGCGGTGT CATCAATCAG TTTCCAAAAG GATCTTTTGG AAAATTACGA GAACCTAGAT 
ATCCTCGAGT ATGCCTTCGA TAGAAATCAG GCGAATTATA CTATGGAAAC CTGCTCTGAA 
GAAGGTATTG AAGTCATATC CATAGGACAA AATGCCGAAA CATTATCGGA AGCAACATCA 
GAGTTTGAAA TAGCAATTCT TGAAAATAGA ATACATTTCA AAAATCCCAT GTTCCTACAT 
CATTGTGCCA ATAGTCATAT ATTCACAACG ATTGACGGAT ATATGAAGCC AATAAAAGAA 
TCGCGGAATT CAAACAATAA AATCGACATC GTAGCTTCAA CTGTCAATGC CATCGCCAGA 
TGCCTATGGA ACCAAAGCAA TCAGGTTATG GCCCCAGGTG TTATTGCGTC CATTCAAATT 
TTAAATAAGA GATAA

Protein sequence

MKYEEIYNNL DPLSKQQYSY PYKVLNGTLG TEVCELTRLA CERSFRDFEL PDFYYDPTDP 
ERFRFLTTKL VYLAGVGSVG GTHVQIEDWQ LWYFSQLLGW KNANGRNKGK RRFRKGSLWV 
ARGNNKTGAG AWFCLYMLLC DGEWDPQVYS VGVDRDQASH TFKAAANQIE TNPKLFKALG 
AQVYSKFIKG IQNYKGENKL GVFKALARGA SKMNGLNIHF AFLDELHAYP DRLTYDVIVS 
GAKKRDQSLV LAASTAGLNL DSFGYEDYCY ARSVLRQEFD QQDEQFFSCV WEADEGDDPY 
SEATWEKANP CWNSAIDQLS FRAEAASAKR IPSKRREFFT KNLNQWLSSG TTWLDMDAVK 
ACYDPDIEED DDYDFGITGI DLGSRSDLCV YTNVFVNTID EQLHYYVFPH PYTSEGFLEK 
NISSQFRAWQ NDGWLTVHKG NAVSSISFQK DLLENYENLD ILEYAFDRNQ ANYTMETCSE 
EGIEVISIGQ NAETLSEATS EFEIAILENR IHFKNPMFLH HCANSHIFTT IDGYMKPIKE 
SRNSNNKIDI VASTVNAIAR CLWNQSNQVM APGVIASIQI LNKR